← all datasets

AlpacaEval

Emerging

5papers using it

20,423HF downloads

65HF likes

2024first seen

Data for alpaca_eval, which aims to help automatic evaluation of instruction-following models

🤗 Hugging Face⚖ cc-by-nc-4.0

Papers using AlpacaEval (5)

References Improve LLM Alignment in Non-Verifiable Domains2026

Online Rubrics Elicitation from Pairwise Comparisons2025

Pretrain Value, Not Reward: Decoupled Value Policy Optimization2025

Post-hoc Reward Calibration: A Case Study on Length Bias2024 · 1 cites

Sentence-level Reward Model can Generalize Better for Aligning LLM from Human Preference2025

AlpacaEval — datasets — reinforcement-learning