VoiceBank-DEMAND

Emerging

47papers using it

2021first seen

VoiceBank-DEMAND is a dataset used to evaluate speech quality by providing diverse audio samples with corresponding perceptual mean opinion scores (MOS).

🔎 Find this dataset

Papers using VoiceBank-DEMAND (47)

PrimeK-Net: Multi-scale Spectral Learning via Group Prime-Kernel Convolutional Neural Networks for Single Channel Speech Enhancement2025 · 7 cites

ZipEnhancer: Dual-Path Down-Up Sampling-based Zipformer for Monaural Speech Enhancement2025 · 5 cites

QC-GAN: A Parameter-Efficient Quaternion Conformer GAN for High-Fidelity Speech Enhancement2026

Posterior Transition Modeling for Unsupervised Diffusion-Based Speech Enhancement2025 · 2 cites

xLSTM-SENet: xLSTM for Single-Channel Speech Enhancement2025 · 2 cites

Magnitude-Phase Dual-Path Speech Enhancement Network based on Self-Supervised Embedding and Perceptual Contrast Stretch Boosting2025 · 1 cites

SB-RF: Schr\"odinger Bridge Rectified Flow for One-Step Robust Speech Enhancement2026

G-MaP-SE: Guided Speech Enhancement via GMM-Based Prior Matching2026

BASENet: Band-Adapted Speech Enhancement Network with Cross-Band Attention2026

Few-Shot and Pseudo-Label Guided Speech Quality Evaluation with Large Language Models2026

Speech Enhancement Based on Drifting Models2026

Diffusion-based Frameworks for Unsupervised Speech Enhancement2026

Beyond Performance: Probing Representation Dynamics In Speech Enhancement Models2025

I-DCCRN-VAE: An Improved Deep Representation Learning Framework for Complex VAE-based Single-channel Speech Enhancement2025

MeanFlowSE: one-step generative speech enhancement via conditional mean flow2025

Investigation of Speech and Noise Latent Representations in Single-channel VAE-based Speech Enhancement2025

EffiFusion-GAN: Efficient Fusion Generative Adversarial Network for Speech Enhancement2025

Robust One-step Speech Enhancement via Consistency Distillation2025

Do We Need EMA for Diffusion-Based Speech Enhancement? Toward a Magnitude-Preserving Network Architecture2025

aTENNuate: Optimized Real-time Speech Enhancement with Deep SSMs on Raw Audio2024

CMGAN: Conformer-based Metric GAN for Speech Enhancement2022 · 118 cites

MP-SENet: A Speech Enhancement Model with Parallel Denoising of Magnitude and Phase Spectra2023 · 113 cites

MANNER: Multi-view Attention Network for Noise Erasure2022 · 57 cites

MetricGAN+/-: Increasing Robustness of Noise Reduction on Unseen Data2022 · 11 cites

Single-Channel Speech Enhancement with Deep Complex U-Networks and Probabilistic Latent Space Models2023 · 5 cites

TENET: A Time-reversal Enhancement Network for Noise-robust ASR2021 · 3 cites

A General Unfolding Speech Enhancement Method Motivated by Taylor's Theorem2022 · 2 cites

Perceptual Contrast Stretching on Target Feature for Speech Enhancement2022 · 1 cites

SCP-GAN: Self-Correcting Discriminator Optimization for Training Consistency Preserving Metric GAN on Speech Enhancement Tasks2022 · 1 cites

Diffusion-based Generative Speech Source Separation2022 · 1 cites

THLNet: two-stage heterogeneous lightweight network for monaural speech enhancement2023 · 1 cites

A Multi-dimensional Deep Structured State Space Approach to Speech Enhancement Using Small-footprint Models2023 · 1 cites

Spiking Structured State Space Model for Monaural Speech Enhancement2023 · 1 cites

An Investigation of Incorporating Mamba for Speech Enhancement2024 · 1 cites

Speech enhancement deep-learning architecture for efficient edge processing2024 · 1 cites

BSS-CFFMA: Cross-Domain Feature Fusion and Multi-Attention Speech Enhancement Network based on Self-Supervised Embedding2024 · 1 cites

OSSEM: one-shot speaker adaptive speech enhancement using meta learning2021

Investigating self-supervised learning for speech enhancement and separation2022

TridentSE: Guiding Speech Enhancement with 32 Global Tokens2022

Cold Diffusion for Speech Enhancement2022

Efficient Monaural Speech Enhancement using Spectrum Attention Fusion2023

MUSE: Flexible Voiceprint Receptive Fields and Multi-Path Fusion Enhanced Taylor Transformer for U-Net-based Speech Enhancement2024

Exploiting Consistency-Preserving Loss and Perceptual Contrast Stretching to Boost SSL-based Speech Enhancement2024

Effective Noise-aware Data Simulation for Domain-adaptive Speech Enhancement Leveraging Dynamic Stochastic Perturbation2024

Speech-Declipping Transformer with Complex Spectrogram and Learnerble Temporal Features2024

A Neural Denoising Vocoder for Clean Waveform Generation from Noisy Mel-Spectrogram based on Amplitude and Phase Predictions2024

From KAN to GR-KAN: Advancing Speech Enhancement with KAN-Based Methodology2024