← all datasets

AMC

Emerging

7papers using it

15HF downloads

0HF likes

2025first seen

🤗 Hugging Face

Papers using AMC (7)

Distribution-Aware Reward Estimation for Test-Time Reinforcement Learning2026

Transformation-Augmented GRPO for Enhancing Exploration in Reasoning of Large Language Models2026

Efficient Reinforcement Finetuning via Adaptive Curriculum Learning2025

SEED-GRPO: Semantic Entropy Enhanced GRPO for Uncertainty-Aware Policy Optimization2025

LIMOPro: Reasoning Refinement for Efficient and Effective Test-time Scaling2025

Inpainting-Guided Policy Optimization for Diffusion Large Language Models2025

Can LLMs Guide Their Own Exploration? Gradient-Guided Reinforcement Learning for LLM Reasoning2025

AMC — datasets — llm-papers