MBPP mbpp-2 Leaderboard

#	Model	Improvement	Paper
1	Self-Correcting Code Generation Using Small Language Models	35.80	—
2	RGD: Multi-LLM Based Agent Debugger via Refinement and Generation Guidance	16.20	—
3	AdapTrack: Constrained Decoding without Distorting LLM's Output Intent	6.42	—

MBPP mbpp-2 Leaderboard