← all datasets

MATH-500

Emerging

8papers using it

2025first seen

🔎 Find this dataset

Papers using MATH-500 (8)

Walk Before You Run! Concise LLM Reasoning via Reinforcement Learning2025

Maximizing Rollout Informativeness under a Fixed Budget: A Submodular View of Tree Search for Tool-Use Agentic Reinforcement Learning2026

SAGE-32B: Agentic Reasoning Via Iterative Distillation2026

Counterfactual Credit Policy Optimization for Multi-Agent Collaboration2026

What If We Allocate Test-Time Compute Adaptively?2026

PILOT: Planning via Internalized Latent Optimization Trajectories for Large Language Models2026

Reinforce LLM Reasoning through Multi-Agent Reflection2025

A*-Decoding: Token-Efficient Inference Scaling2025