Awesome Audio-Visual — curated papers, datasets & benchmarks · Awesome Multimodal

Datasets & benchmarks

AudioCaps10 papers

InfoSeek7 papers

CMU-MOSI6 papers

A-OKVQA6 papers

Video-MME5 papers

VGGSound5 papers

VQA-RAD5 papers

Key papers