Awesome Evaluation — curated papers, datasets & benchmarks · Awesome LLM Papers

Datasets & benchmarks

MMLU54 papers · 🤗

MMLU-Pro22 papers · 🤗

MT-Bench20 papers

HumanEval19 papers · 🤗

HotpotQA19 papers · 🤗

MATH-50019 papers · 🤗

TruthfulQA17 papers · 🤗

BEIR17 papers · 🤗

Arena-Hard17 papers · 🤗

GPQA14 papers · 🤗

Key papers