OmniVideoBench

Name: OmniVideoBench
License: cc-by-nc-nd-4.0

Emerging

2papers using it

2,766HF downloads

5HF likes

2026first seen

OmniVideoBench: Towards Audio-Visual Understanding Evaluation for Omni MLLMs ✨ Overview Recent advances in multimodal large language models (MLLMs) have brought remarkable progress in video understanding.However, most existing benchmarks fail to jointly evaluate both audio and visual reasoning — often focusing on one m

🤗 Hugging Face⚖ cc-by-nc-nd-4.0

Papers using OmniVideoBench (2)

Agentic Active Omni-Modal Perception for Multi-Hop Audio-Visual Reasoning2026

OmniRAG-Agent: Agentic Omnimodal Reasoning for Low-Resource Long Audio-Video Question Answering2026