Awesome Vision-Language Models — curated papers, datasets & benchmarks · Awesome Multimodal

Datasets & benchmarks

LIBERO37 papers

MS COCO32 papers

MMBench28 papers

nuScenes27 papers

ImageNet24 papers

ScienceQA17 papers

Key papers