← all datasets

RMBench

Emerging

6papers using it

2025first seen

RMBench is a benchmark dataset used to evaluate the performance of reward models in aligning Large Language Models with human preferences.

🔎 Find this dataset

Papers using RMBench (6)

PaTaRM: Bridging Pairwise and Pointwise Signals via Preference-Aware Task-Adaptive Reward Modeling2025 · 4 cites

CDRRM: Contrast-Driven Rubric Generation for Reliable and Interpretable Reward Modeling2026

HelpSteer3-Preference: Open Human-Annotated Preference Data across Diverse Tasks and Languages2025

Error Typing for Smarter Rewards: Improving Process Reward Models with Error-Aware Hierarchical Supervision2025

HelpSteer3-Preference: Open Human-Annotated Preference Data across Diverse Tasks and Languages2025

Efficient Process Reward Model Training via Active Learning2025

RMBench — datasets — llm-papers