V*Bench

Emerging

3papers using it

2025first seen

The 'V* Bench' dataset/benchmark is used to evaluate the performance and efficiency of agentic multimodal large language models (MLLMs) in tasks involving visual perception and reasoning.

🔎 Find this dataset

Papers using V*Bench (3)

SpecEyes: Accelerating Agentic Multimodal LLMs via Speculative Perception and Planning2026

Textual Steering Vectors Can Improve Visual Understanding in Multimodal Large Language Models2025