LibriMix

Emerging

28papers using it

2022first seen

LibriMix is a dataset that contains mixed speech recordings of multiple talkers and is used to evaluate multi-talker automatic speech recognition (MT-ASR) systems.

🔎 Find this dataset

Papers using LibriMix (28)

Unifying Diarization, Separation, and ASR with Multi-Speaker Encoder2025 · 6 cites

Serialized Output Prompting for Large Language Model-based Multi-Talker Speech Recognition2025 · 2 cites

Distilling LLM Semantic Priors into Encoder-Only Multi-Talker ASR with Talker-Count Routing2026

SLM-SS: Speech Language Model for Generative Speech Separation2026

Adapting Diarization-Conditioned Whisper for End-to-End Multi-Talker Speech Recognition2025

CMT-LLM: Contextual Multi-Talker ASR Utilizing Large Language Models2025

An Investigation on Speaker Augmentation for End-to-End Speaker Extraction2025

Universal Speaker Embedding Free Target Speaker Extraction and Personal Voice Activity Detection2025

A Sidecar Separator Can Convert a Single-Talker Speech Recognition System to a Multi-Talker One2023 · 16 cites

Advancing Multi-talker ASR Performance with Large Language Models2024 · 9 cites

Listen only to me! How well can target speech extraction handle false alarms?2022 · 3 cites

Exploring Self-Attention Mechanisms for Speech Separation2022 · 2 cites

EEND-SS: Joint End-to-End Neural Speaker Diarization and Speech Separation for Flexible Number of Speakers2022 · 2 cites

Noise-Aware Speech Separation with Contrastive Learning2023 · 1 cites

Unified Modeling of Multi-Talker Overlapped Speech Recognition and Diarization with a Sidecar Separator2023 · 1 cites

EEND-DEMUX: End-to-End Neural Speaker Diarization via Demultiplexed Speaker Embeddings2023 · 1 cites

USEF-TSE: Universal Speaker Embedding Free Target Speaker Extraction2024 · 1 cites

MixCycle: Unsupervised Speech Separation via Cyclic Mixture Permutation Invariant Training2022

Individualized Conditioning and Negative Distances for Speaker Separation2022

Monaural Multi-Speaker Speech Separation Using Efficient Transformer Model2023

USED: Universal Speaker Extraction and Diarization2023

Selective HuBERT: Self-Supervised Pre-Training for Target Speaker in Clean and Mixture Speech2023

Target Speech Extraction with Pre-trained Self-supervised Learning Models2024

Serialized Output Training by Learned Dominance2024

Empowering Whisper as a Joint Multi-Talker and Target-Talker Speech Recognition System2024

Serialized Speech Information Guidance with Overlapped Encoding Separation for Multi-Speaker Automatic Speech Recognition2024

Hypothesis Clustering and Merging: Novel MultiTalker Speech Recognition with Speaker Tokens2024

Multiple Choice Learning for Efficient Speech Separation with Many Speakers2024