← all datasets

AIME-25

Emerging

25papers using it

476HF downloads

2HF likes

2025first seen

The AIME25 part 1 exam from the website.

🤗 Hugging Face⚖ mit

Papers using AIME-25 (25)

Transformation-Augmented GRPO for Enhancing Exploration in Reasoning of Large Language Models2026

VTC-R1: Vision-Text Compression for Efficient Long-Context Reasoning2026

TriAttention: Efficient Long Reasoning with Trigonometric KV Compression2026

Benchmarking EngGPT2-16B-A3B against Comparable Italian and International Open-source LLMs2026

Test-time Recursive Thinking: Self-Improvement without External Feedback2026

Prompting Test-Time Scaling Is A Strong LLM Reasoning Data Augmentation2025

RefCritic: Training Long Chain-of-Thought Critic Models with Refinement Feedback2025

MoL-RL: Distilling Multi-Step Environmental Feedback into LLMs for Feedback-Independent Reasoning2025

Light-R1: Curriculum SFT, DPO and RL for Long COT from Scratch and Beyond2025

Pensez: Less Data, Better Reasoning -- Rethinking French LLM2025

Skywork Open Reasoner 1 Technical Report2025

Beyond the 80/20 Rule: High-Entropy Minority Tokens Drive Effective Reinforcement Learning for LLM Reasoning2025

RefCritic: Training Long Chain-of-Thought Critic Models with Refinement Feedback2025

SAND-Math: Using LLMs to Generate Novel, Difficult and Useful Mathematics Questions and Answers2025

Beyond Pass@1: Self-Play with Variational Problem Synthesis Sustains RLVR2025

DCPO: Dynamic Clipping Policy Optimization2025

PromptCoT 2.0: Scaling Prompt Synthesis for Large Language Model Reasoning2025

ScaleDiff: Scaling Difficult Problems for Advanced Mathematical Reasoning2025

From Harm to Help: Turning Reasoning In-Context Demos into Assets for Reasoning LMs2025

Meta-Awareness Enhances Reasoning Models: Self-Alignment Reinforcement Learning2025

Skill-Targeted Adaptive Training2025

A^2FM: An Adaptive Agent Foundation Model for Tool-Aware Hybrid Reasoning2025

Shorter but not Worse: Frugal Reasoning via Easy Samples as Length Regularizers in Math RLVR2025

Can LLMs Guide Their Own Exploration? Gradient-Guided Reinforcement Learning for LLM Reasoning2025

Scaling Reasoning without Attention2025