← authors · overview

Haitao Mi

12 papers · 619 citations

Most-cited papers

Scaling Synthetic Data Creation With 1,000,000,000 Personas
2024 · 345 citations
Toward Self-improvement Of Llms Via Imagination, Searching, And Criticizing
2024 · 138 citations
Iterative Nash Policy Optimization: Aligning Llms With General Preferences Via No-regret Learning
2024 · 40 citations
The Trickle-down Impact Of Reward (in-)consistency On RLHF
2023 · 29 citations
Verified Critical Step Optimization For LLM Agents
2026
Inference-time Scaling Of Verification: Self-evolving Deep Research Agents Via Test-time Rubric-guided Verification
2026
Webaggregator: Enhancing Compositional Reasoning Capabilities Of Deep Research Agent Foundation Models
2026

Topics

Training Techniques Safety & Alignment In-Context Learning Prompting Reinforcement Learning Code Agents Browser Agents RAG Efficiency Fine-Tuning