← all datasets

Common Voice

Canonical

48papers using it

2021first seen

Mozilla's massively-multilingual, crowd-sourced read-speech corpus for speech recognition.

🔎 Find this dataset

Papers using Common Voice (48)

Swedish Whispers; Leveraging a Massive Speech Corpus for Swedish Speech Recognition2025 · 1 cites

SN-WER: Script-Normalized WER for Multi-Script Indic ASR Evaluation2026

Sometin Beta Pass Notin (SBPN): Improving Multilingual ASR for Nigerian Languages via Knowledge Distillation2026

FLEURS-Kobani: Extending the FLEURS Dataset for Northern Kurdish2026

IDMap: A Pseudo-Speaker Generator Framework Based on Speaker Identity Index to Vector Mapping2025

M-CIF: Multi-Scale Alignment For CIF-Based Non-Autoregressive ASR2025

Scalable Controllable Accented TTS2025

DeRAGEC: Denoising Named Entity Candidates with Synthetic Rationale for ASR Error Correction2025

Robust Unsupervised Adaptation of a Speech Recogniser Using Entropy Minimisation and Speaker Codes2025

CMU's IWSLT 2025 Simultaneous Speech Translation System2025

Evaluation of LLMs in Speech is Often Flawed: Test Set Contamination in Large Language Models for Speech Recognition2025

Dysarthria Normalization via Local Lie Group Transformations for Robust ASR2025

An Exhaustive Evaluation of TTS- and VC-based Data Augmentation for ASR2025

Whistle: Data-Efficient Multilingual and Crosslingual Speech Recognition via Weakly Phonetic Supervision2024

Adaptive multilingual speech recognition with pretrained models2022 · 17 cites

Exploring Capabilities of Monolingual Audio Transformers using Large Datasets in Automatic Speech Recognition of Czech2022 · 14 cites

CORAA: a large corpus of spontaneous and prepared speech manually validated for speech recognition in Brazilian Portuguese2021 · 10 cites

Supervised Contrastive Learning for Accented Speech Recognition2021 · 9 cites

Advancing CTC-CRF Based End-to-End Speech Recognition with Wordpieces and Conformers2021 · 4 cites

Textless Speech-to-Speech Translation With Limited Parallel Data2023 · 2 cites

Custom Data Augmentation for low resource ASR using Bark and Retrieval-Based Voice Conversion2023 · 2 cites

GigaSpeech 2: An Evolving, Large-Scale and Multi-domain ASR Corpus for Low-Resource Languages with Automated Crawling, Transcription and Refinement2024 · 2 cites

Ask2Mask: Guided Data Selection for Masked Speech Modeling2022 · 1 cites

Speech Corpora Divergence Based Unsupervised Data Selection for ASR2023 · 1 cites

Some voices are too common: Building fair speech recognition systems using the Common Voice dataset2023 · 1 cites

XLSR-Transducer: Streaming ASR for Self-Supervised Pretrained Models2024 · 1 cites

Pseudo-Labeling for Massively Multilingual Speech Recognition2021

XLS-R: Self-supervised Cross-lingual Speech Representation Learning at Scale2021

Improving the transferability of speech separation by meta-learning2022

Distilling a Pretrained Language Model to a Multilingual ASR Model2022

ASR2K: Speech Recognition for Around 2000 Languages without Audio2022

MeWEHV: Mel and Wave Embeddings for Human Voice Tasks2022

Can we use Common Voice to train a Multi-Speaker TTS system?2022

Iterative pseudo-forced alignment by acoustic CTC loss for self-supervised ASR domain adaptation2022

Unsupervised ASR via Cross-Lingual Pseudo-Labeling2023

TranUSR: Phoneme-to-word Transcoder Based Unified Speech Representation Learning for Cross-lingual Speech Recognition2023

Boosting End-to-End Multilingual Phoneme Recognition through Exploiting Universal Speech Attributes Constraints2023

Connecting Speech Encoder and Large Language Model for ASR2023

SSHR: Leveraging Self-supervised Hierarchical Representations for Multilingual Automatic Speech Recognition2023

LUPET: Incorporating Hierarchical Information Path into Multilingual ASR2024

GLOBE: A High-quality English Corpus with Global Accents for Zero-shot Speaker Adaptive Text-to-Speech2024

Low-Resourced Speech Recognition for Iu Mien Language via Weakly-Supervised Phoneme-based Multilingual Pre-training2024

Improving noisy student training for low-resource languages in End-to-End ASR using CycleGAN and inter-domain losses2024

Large Language Model Should Understand Pinyin for Chinese ASR Error Correction2024

Fast Streaming Transducer ASR Prototyping via Knowledge Distillation with Whisper2024

CVSS Corpus and Massively Multilingual Speech-to-Speech Translation2022

Indonesian Automatic Speech Recognition with XLSR-532023

A Comparative Analysis of Bilingual and Trilingual Wav2Vec Models for Automatic Speech Recognition in Multilingual Oral History Archives2024

Common Voice dataset — papers, benchmarks & downloads · Speech Audio