We-Math

Emerging

4papers using it

2025first seen

The 'We-Math' dataset is used to evaluate the reasoning ability of multi-modal large language models (MLLMs) in mathematical problem-solving without requiring ground truth labels.

🔎 Find this dataset

Papers using We-Math (4)

Advancing Multimodal Reasoning: From Optimized Cold Start to Staged Reinforcement Learning2025

Athena: Enhancing Multimodal Reasoning with Data-efficient Process Reward Models2025

Advancing Multimodal Reasoning via Reinforcement Learning with Cold Start2025

First SFT, Second RL, Third UPT: Continual Improving Multi-Modal LLM Reasoning via Unsupervised Post-Training2025