← authors · overview

Yu Su

12 papers · 2063 citations

Most-cited papers

Agentbench: Evaluating Llms As Agents
2023 · 710 citations
Mammoth: Building Math Generalist Models Through Hybrid Instruction Tuning
2023 · 554 citations
Travelplanner: A Benchmark For Real-world Planning With Language Agents
2024 · 367 citations
From RAG To Memory: Non-parametric Continual Learning For Large Language Models
2025 · 125 citations
Grokked Transformers Are Implicit Reasoners: A Mechanistic Journey To The Edge Of Generalization
2024 · 80 citations
One Step At A Time: Long-horizon Vision-and-language Navigation With Milestones
2022 · 18 citations
Agentbench: Evaluating Llms As Agents
2023
CUBE: A Standard For Unifying Agent Benchmarks
2026

Topics

Evaluation In-Context Learning Training Techniques Agentic Model Architecture Reinforcement Learning RAG Fine-Tuning Uncategorized Multi-Agent