E-VQA

Emerging

9papers using it

14HF downloads

0HF likes

2022first seen

The E-VQA dataset is used to evaluate knowledge-based visual question answering by assessing the integration of visual understanding with external knowledge retrieval in multimodal queries.

🤗 Hugging Face

Papers using E-VQA (9)

Region-R1: Reinforcing Query-Side Region Cropping for Multi-Modal Re-Ranking2026

WikiSeeker: Rethinking the Role of Vision-Language Models in Knowledge-Based Visual Question Answering2026

Learning to Search: A Decision-Based Agent for Knowledge-Based Visual Question Answering2026

When RAG Hurts: Diagnosing and Mitigating Attention Distraction in Retrieval-Augmented LVLMs2026

CC-VQA: Conflict- and Correlation-Aware Method for Mitigating Knowledge Conflict in Knowledge-Based Visual Question Answering2026

Reconstruction as a Bridge for Event-Based Visual Question Answering2025

Knowledge-based Visual Question Answer with Multimodal Processing, Retrieval and Filtering2025

Towards Reasoning-Aware Explainable VQA2022 · 2 cites

Multimodal Rationales for Explainable Visual Question Answering2024