← all datasets

Minerva

Emerging

6papers using it

2025first seen

🔎 Find this dataset

Papers using Minerva (6)

Transformation-Augmented GRPO for Enhancing Exploration in Reasoning of Large Language Models2026

Long Chain-of-Thought Compression via Fine-Grained Group Policy Optimization2026

Prompting Test-Time Scaling Is A Strong LLM Reasoning Data Augmentation2025

SEED-GRPO: Semantic Entropy Enhanced GRPO for Uncertainty-Aware Policy Optimization2025

Socratic-Zero : Bootstrapping Reasoning via Data-Free Agent Co-evolution2025

Walk Before You Run! Concise LLM Reasoning via Reinforcement Learning2025

Minerva — datasets — llm-papers