← all datasets

HumanEval-plus

Emerging

6papers using it

2024first seen

🔎 Find this dataset

Papers using HumanEval-plus (6)

Demystifying Errors in LLM Reasoning Traces: An Empirical Study of Code Execution Simulation2025

Benchmarking AI Models in Software Engineering: A Review, Search Tool, and Enhancement Protocol2025

ACECODER: Acing Coder RL via Automated Test-Case Synthesis2025

Dynamic Scaling of Unit Tests for Code Reward Modeling2025

Uncovering Weaknesses in Neural Code Generation2024 · 2 cites

Multi-Programming Language Ensemble for Code Generation in Large Language Model2024 · 1 cites

HumanEval-plus dataset — papers, benchmarks & downloads · AI for Code