← all datasets

HealthBench

Emerging

9papers using it

3,901HF downloads

161HF likes

2025first seen

Contains the data for the HealthBench eval. For the reference implementation of HealthBench, see OpenAI's simple-evals repo.

🤗 Hugging Face⚖ mit

Papers using HealthBench (9)

Self-Rewarding Rubric-Based Reinforcement Learning for Open-Ended Reasoning2025 · 3 cites

Baichuan-M2: Scaling Medical Capability with Large Verifier System2025 · 1 cites

Mitigating False Credit Propagation: Probabilistic Graphical Reward Aggregation for Rubric-Based Reinforcement Learning2026

Improving Heart-Focused Medical Question Answering in LLMs via Variance-Aware Rubric Rewards with GRPO2026

Alternating Reinforcement Learning with Contextual Rubric Rewards: Beyond the Scalarization Strategy2026

RubricHub: A Comprehensive and Highly Discriminative Rubric Dataset via Automated Coarse-to-Fine Generation2026

Multidimensional Rubric-oriented Reward Model Learning via Geometric Projection Reference Constraints2025

Doctor-R1: Mastering Clinical Inquiry with Experiential Agentic Reinforcement Learning2025

Rubrics as Rewards: Reinforcement Learning Beyond Verifiable Domains2025

HealthBench dataset — papers, benchmarks & downloads · Reinforcement Learning