MathVista

Emerging

26papers using it

2023first seen

MathVista is a benchmark dataset used to evaluate the reasoning ability of multi-modal large language models (MLLMs) without requiring ground truth labels.

🔎 Find this dataset

Papers using MathVista (26)

Qwen3-VL Technical Report2025 · 12 cites

Internvl3.5: Advancing Open-source Multimodal Models In Versatility, Reasoning, And Efficiency2025 · 2 cites

Vision-R1: Incentivizing Reasoning Capability in Multimodal Large Language Models2025 · 1 cites

TVI-CoT: Text-Visual Interleaved Chain-of-Thought Reasoning for Multimodal Understanding2026

Difference Feedback: Generating Multimodal Process-Level Supervision for VLM Reinforcement Learning2026

Credit Where It is Due: Cross-Modality Connectivity Drives Precise Reinforcement Learning for MLLM Reasoning2026

EvoLMM: Self-Evolving Large Multimodal Models with Continuous Rewards2025

ChainV: Atomic Visual Hints Make Multimodal Reasoning Shorter and Better2025

Diagnosing Visual Reasoning: Challenges, Insights, and a Path Forward2025

VOLD: Reasoning Transfer from LLMs to Vision-Language Models via On-Policy Distillation2025

SAIL-VL2 Technical Report2025

Training Vision-Language Process Reward Models for Test-Time Scaling in Multimodal Reasoning: Key Insights and Lessons Learned2025

Qianfan-vl: Domain-enhanced Universal Vision-language Models2025

CoRGI: Verified Chain-of-Thought Reasoning with Post-hoc Visual Grounding2025

Athena: Enhancing Multimodal Reasoning with Data-efficient Process Reward Models2025

Mmjee-eval: A Bilingual Multimodal Benchmark For Evaluating Scientific Reasoning In Vision-language Models2025

SRPO: Enhancing Multimodal LLM Reasoning via Reflection-Aware Reinforcement Learning2025

Advancing Multimodal Reasoning via Reinforcement Learning with Cold Start2025

First SFT, Second RL, Third UPT: Continual Improving Multi-Modal LLM Reasoning via Unsupervised Post-Training2025

Skywork R1V: Pioneering Multimodal Reasoning with Chain-of-Thought2025

OpenVLThinker: Complex Vision-Language Reasoning via Iterative SFT-RL Cycles2025

Evolutionary Prompt Optimization Discovers Emergent Multimodal Reasoning Strategies in Vision-Language Models2025

2.5 Years in Class: A Multimodal Textbook for Vision-Language Pretraining2025

MathScape: Benchmarking Multimodal Large Language Models in Real-World Mathematical Contexts2024

CMM-Math: A Chinese Multimodal Math Dataset To Evaluate and Enhance the Mathematics Reasoning of Large Multimodal Models2024 · 1 cites

Text as Images: Can Multimodal Large Language Models Follow Printed Instructions in Pixels?2023