← all datasets

LiveCodeBench

Emerging

22papers using it

2025first seen

'LiveCodeBench' is a benchmark dataset used to evaluate the performance of reasoning models in code generation tasks.

🔎 Find this dataset

Papers using LiveCodeBench (22)

Kimi k1.5: Scaling Reinforcement Learning with LLMs2025 · 11 cites

Thinking-Free Policy Initialization Makes Distilled Reasoning Models More Effective and Efficient Reasoners2025 · 4 cites

Ring-lite: Scalable Reasoning via C3PO-Stabilized Reinforcement Learning for LLMs2025

Don't Let Gains FADE: Breaking Down Policy Gradient Weights in RL2026

ACECODER: Acing Coder RL via Automated Test-Case Synthesis2025 · 3 cites

Process Reward Models That Think2025 · 1 cites

Learning to Orchestrate Agents in Natural Language with the Conductor2025

PopuLoRA: Co-Evolving LLM Populations for Reasoning Self-Play2026

Beyond Execution: Static-Analysis Rewards and Hint-Conditioned Diffusion RL for Code Generation2026

Apriel-1.5-OpenReasoner: RL Post-Training for General-Purpose and Efficient Reasoning2026

ReflexiCoder: Teaching Large Language Models to Self-Reflect on Generated Code and Self-Correct It via Reinforcement Learning2026

SAGE: Multi-Agent Self-Evolution for LLM Reasoning2026

Bridging Online and Offline RL: Contextual Bandit Learning for Multi-Turn Code Generation2026

LLMs Can Learn to Reason Via Off-Policy RL2026

CLEANER: Self-Purified Trajectories Boost Agentic Reinforcement Learning2026

FunPRM: Function-as-Step Process Reward Model with Meta Reward Correction for Code Generation2026

Agnostics: Learning to Code in Any Programming Language via Reinforcement with a Universal Learning Environment2025

Sample More to Think Less: Group Filtered Policy Optimization for Concise Reasoning2025

ReVeal: Self-Evolving Code Agents via Reliable Self-Verification2025

AceReason-Nemotron: Advancing Math and Code Reasoning through Reinforcement Learning2025

Skywork Open Reasoner 1 Technical Report2025

SRPO: A Cross-Domain Implementation of Large-Scale Reinforcement Learning on LLM2025

LiveCodeBench dataset — papers, benchmarks & downloads · Reinforcement Learning