WSJ-0-2mix-extr

Emerging

4papers using it

2022first seen

The 'WSJ0-2mix-extr' dataset/benchmark contains mixed audio recordings of two speakers and is used to evaluate target-speaker automatic speech recognition (TS-ASR) performance.

🔎 Find this dataset

Papers using WSJ-0-2mix-extr (4)

Conformer-based Target-speaker Automatic Speech Recognition For Single-channel Audio2023 · 17 cites

Simultaneous Speech Extraction For Multiple Target Speakers Under The Meeting Scenarios2022 · 1 cites

Simultaneous Speech Extraction for Multiple Target Speakers under the Meeting Scenarios2022 · 1 cites

Conformer-based Target-Speaker Automatic Speech Recognition for Single-Channel Audio2023