← authors · overview

Yaodong Yang

20 papers · 1415 citations

Most-cited papers

Safe RLHF: Safe Reinforcement Learning From Human Feedback
2023 · 645 citations
JARVIS-1: Open-world Multi-task Agents With Memory-augmented Multimodal Language Models
2023 · 177 citations
Pku-saferlhf: Towards Multi-level Safety Alignment For Llms With Human Preference
2024 · 163 citations
Proagent: Building Proactive Cooperative Agents With Large Language Models
2023 · 140 citations
Aligner: Efficient Alignment By Learning To Correct
2024 · 87 citations
Theoretically Guaranteed Policy Improvement Distilled From Model-based Planning
2023 · 1 citations
Model Evolution Framework With Genetic Algorithm For Multi-task Reinforcement Learning
2025
Towards Efficient Collaboration Via Graph Modeling In Reinforcement Learning
2024

Topics

Reinforcement Learning Safety & Alignment Training Techniques Agentic Model Architecture Multi-Agent In-Context Learning Vision-Language Efficiency Evaluation