← authors · overview

Yi Wu

12 papers · 737 citations

Most-cited papers

Is DPO Superior To PPO For LLM Alignment? A Comprehensive Study
2024 · 273 citations
Bitnet: Scaling 1-bit Transformers For Large Language Models
2023 · 220 citations
Language Agents With Reinforcement Learning For Strategic Play In The Werewolf Game
2023 · 144 citations
Llm-powered Hierarchical Language Agent For Real-time Human-ai Coordination
2023 · 66 citations
Real: Efficient RLHF Training Of Large Language Models With Parameter Reallocation
2024 · 29 citations
Beyond Ten Turns: Unlocking Long-horizon Agentic Search With Large-scale Asynchronous RL
2025
Focus On The Core: Empowering Diffusion Large Language Models By Self-contrast
2026
Learning Design And Construction With Varying-sized Materials Via Prioritized Memory Resets
2022

Topics

Efficiency Training Techniques Reinforcement Learning Agentic Uncategorized Model Architecture Safety & Alignment Prompting Vision-Language Fine-Tuning