MMMU-Pro

Emerging

14papers using it

2024first seen

MMMU-Pro (A More Robust Multi-discipline Multimodal Understanding Benchmark) 🌐 Homepage | 🏆 Leaderboard | 🤗 Dataset | 🤗 Paper | 📖 arXiv | GitHub 🔔News 🛠️[2026-05-30] Fixed the option augmentation issue in Vision and Standard (10 options) settings. (validation_Diagnostics_and_Laboratory_Medicine_17) 🛠️[2025-03-0

🔎 Find this dataset

Papers using MMMU-Pro (14)

Xiaomi Mimo-vl-miloco Technical Report2025

OmniThoughtVis: A Scalable Distillation Pipeline for Deployable Multimodal Reasoning Models2026

VLM-RobustBench: A Comprehensive Benchmark for Robustness of Vision-Language Models2026

Vision Verification Enhanced Fusion of VLMs for Efficient Visual Reasoning2026

VOLD: Reasoning Transfer from LLMs to Vision-Language Models via On-Policy Distillation2025

Socratic-MCTS: Test-Time Visual Reasoning by Asking the Right Questions2025

Believing Without Seeing: Quality Scores For Contextualizing Vision-language Model Explanations2025

Jmmmu-pro: Image-based Japanese Multi-discipline Multimodal Understanding Benchmark Via Vibe Benchmark Construction2025

SRPO: Enhancing Multimodal LLM Reasoning via Reflection-Aware Reinforcement Learning2025

VisualWebInstruct: Scaling up Multimodal Instruction Data through Web Search2025

Chain-of-Description: What I can understand, I can put into words2025

MMMU-Pro: A More Robust Multi-discipline Multimodal Understanding Benchmark2024 · 3 cites

VL-RewardBench: A Challenging Benchmark for Vision-Language Generative Reward Models2024 · 2 cites

MAmmoTH-VL: Eliciting Multimodal Reasoning with Instruction Tuning at Scale2024