Awesome Artificial Intelligence — curated papers, datasets & benchmarks · Awesome AI Agents

Datasets & benchmarks

AgentBench2 papers

RoboTwin 2.02 papers

VitaBench2 papers

AJ-Bench1 paper

τ-Bench1 paper

Bottleneck1 paper

Build What I Mean1 paper

Berkeley Function Calling Leaderboard v-31 paper

Key papers