GAIA Benchmark (2023) gaia Leaderboard

#	Model	Score	Paper
1	Agent_v0.1.4	0.83	—
2	Skywork Deep Research Agent v2	0.83	—
3	Agent_v0.1.3	0.82	—
4	🐦‍🔥 AWorld (Run Instantly)	0.82	—
5	Agent_v0.1.2	0.81	—
6	Agent_v0.1.1	0.80	—
7	h2oGPTe Agent v1.6.33	0.80	—
8	Su Zero Ultra	0.80	—
9	Agent2030-v2.3	0.79	—
10	Agent_v0.1.0	0.79	—
11	h2oGPTe Agent v1.6.32	0.79	—
12	desearch	0.78	—
13	🦤 AWorld (Run Instantly)	0.77	—
14	Agent2030-v2.2	0.76	—
15	SU AI Zero	0.76	—
16	Agent_v0.0.9	0.75	—
17	Alita	0.75	—
18	h2oGPTe Agent v1.6.27 \| March 17 original date	0.75	—
19	Agent2030-v2.1	0.74	—
20	Agent_v0.0.8	0.73	—
21	AgentZ_v0.10	0.73	—
22	Langfun Agent v2.3	0.73	—
23	Agent2030-v2.0	0.72	—
24	agent 90000	0.72	—
25	agent-pro	0.72	—
26	agent zero v1.2	0.72	—
27	🦩 AWorld (Run Instantly)	0.72	—
28	Langfun Agent v2.2	0.72	—
29	agent333	0.71	—
30	agent zero v1.1	0.71	—

GAIA Benchmark (2023) gaia Leaderboard