← all datasets

MT-Bench

Canonical

26papers using it

2024first seen

🔎 Find this dataset

Papers using MT-Bench (26)

Alignment through Meta-Weighted Online Sampling: Bridging the Gap between Data Generation and Preference Optimization2025

Token-weighted Direct Preference Optimization with Attention2026

Bridging Draft Policy Misalignment: Group Tree Optimization for Speculative Decoding2025 · 2 cites

TACOS: Open Tagging and Comparative Scoring for Instruction Fine-Tuning Data Selection2025 · 1 cites

Strategic Over-Parameterization for Generalizable Low-Rank Adaptation2026

MMoA: An AI-Agent framework with recurrence for Memoried Mixure-of-Agent2026

SCOPE: Selective Conformal Optimized Pairwise LLM Judging2026

DYCP: Dynamic Context Pruning for Long-Form Dialogue with LLMs2026

Dropping Just a Handful of Preferences Can Change Top Large Language Model Rankings2025

Weights-Rotated Preference Optimization for Large Language Models2025

Not All Preferences are What You Need for Post-Training: Selective Alignment Strategy for Preference Optimization2025

MaPPO: Maximum a Posteriori Preference Optimization with Prior Knowledge2025

Alignment through Meta-Weighted Online Sampling: Bridging the Gap between Data Generation and Preference Optimization2025

ComPO: Preference Alignment via Comparison Oracles2025

ReviewInstruct: A Review-Driven Multi-Turn Conversations Generation Method for Large Language Models2025

MTR-Bench: A Comprehensive Benchmark for Multi-Turn Reasoning Evaluation2025

Alignment Data Map for Efficient Preference Data Selection and Diagnosis2025

RSPO: Regularized Self-Play Alignment of Large Language Models2025

CrowdSelect: Synthetic Instruction Data Selection with Multi-LLM Wisdom2025

DiffPO: Diffusion-styled Preference Optimization for Efficient Inference-Time Alignment of Large Language Models2025

Leveraging Uncertainty Estimation for Efficient LLM Routing2025

RIDE: Enhancing Large Language Model Alignment through Restyled In-Context Learning Demonstration Exemplars2025

Capturing Nuanced Preferences: Preference-Aligned Distillation for Small Language Models2025

Star-Agents: Automatic Data Optimization with LLM Agents for Instruction Tuning2024 · 2 cites

Margin Matching Preference Optimization: Enhanced Model Alignment with Granular Feedback2024

TODO: Enhancing LLM Alignment with Ternary Preferences2024

MT-Bench — datasets — llm-papers