← all datasets

BEIR

Canonical

17papers using it

2021first seen

A heterogeneous benchmark of 18 information-retrieval datasets for zero-shot evaluation of retrieval models.

🔎 Find this dataset

Papers using BEIR (17)

Efficient Constant-Space Multi-Vector Retrieval2025 · 12 cites

Zero-shot Dense Retrieval With Momentum Adversarial Domain Invariant Representations2021 · 19 cites

Beyond Semantic Similarity: Rethinking Retrieval for Agentic Search via Direct Corpus Interaction2026

No More K-means: Single-Stage Sparse Coding for Efficient Multi-Vector Retrieval2026

ColBERT-Att: Late-Interaction Meets Attention for Enhanced Retrieval2026

Multi-Vector Index Compression in Any Modality2026

Incorporating Token Importance in Multi-Vector Retrieval2025

E2Rank: Your Text Embedding can Also be an Effective and Efficient Listwise Reranker2025

Approximate Cluster-based Sparse Document Retrieval With Segmented Maximum Term Weights2024

SPLADE v2: Sparse Lexical and Expansion Model for Information Retrieval2021 · 11 cites

SLIM: Sparsified Late Interaction for Multi-Vector Retrieval with Inverted Indexes2023 · 10 cites

CITADEL: Conditional Token Interaction via Dynamic Lexical Routing for Efficient and Effective Multi-Vector Retrieval2022 · 3 cites

Operational Advice for Dense and Sparse Retrievers: HNSW, Flat, or Inverted Indexes?2024 · 1 cites

Zero-Shot Dense Retrieval with Momentum Adversarial Domain Invariant Representations2021

Anserini Gets Dense Retrieval: Integration of Lucene's HNSW Indexes2023

Approximate Cluster-Based Sparse Document Retrieval with Segmented Maximum Term Weights2024

MUVERA: Multi-Vector Retrieval via Fixed Dimensional Encodings2024

BEIR dataset — papers, benchmarks & downloads · Similarity Search