← all datasets

AlpacaEval

Canonical

10papers using it

20,423HF downloads

65HF likes

2024first seen

Data for alpaca_eval, which aims to help automatic evaluation of instruction-following models

🤗 Hugging Face⚖ cc-by-nc-4.0

Papers using AlpacaEval (10)

Token-weighted Direct Preference Optimization with Attention2026

References Improve LLM Alignment in Non-Verifiable Domains2026

Refine-n-Judge: Curating High-Quality Preference Chains for LLM-Fine-Tuning2025

P3: Prompts Promote Prompting2025

Alignment Data Map for Efficient Preference Data Selection and Diagnosis2025

Implicit Cross-Lingual Rewarding for Efficient Multilingual Preference Alignment2025

XL-Suite: Cross-Lingual Synthetic Training and Evaluation Data for Open-Ended Generation2025

Sentence-level Reward Model can Generalize Better for Aligning LLM from Human Preference2025

Investigating Non-Transitivity in LLM-as-a-Judge2025

Permutative Preference Alignment from Listwise Ranking of Human Judgments2024 · 1 cites

AlpacaEval — datasets — llm-papers