TIMIT

Canonical

47papers using it

2021first seen

A phonetically-transcribed read-speech corpus widely used for acoustic-phonetic and ASR research.

Papers using TIMIT (47)

AISHELL6-whisper: A Chinese Mandarin Audio-visual Whisper Speech Dataset with Speech Recognition Baselines2025 · 6 cites

Gradient-Based Speech-to-Text Alignment for Any ASR Model: From CTC to Speech LLMs2026

Multilingual Word-Level Forced Alignment with Self-Supervised Representations and Learned Dynamic Programming2026

FlowW2N: Whispered-to-Normal Speech Conversion via Flow-Matching2026

Single Channel Blind Dereverberation of Speech Signals2025

BFA: Real-time Multilingual Text-to-speech Forced Alignment2025

Evaluating the Representation of Vowels in Wav2Vec Feature Extractor: A Layer-Wise Analysis Using MFCCs2025

State-Space Models in Efficient Whispered and Multi-dialect Speech Recognition2025

A Differentiable Alignment Framework for Sequence-to-Sequence Modeling via Optimal Transport2025

Back To Supervision: Boosting Word Boundary Detection Through Frame Classification2024

Improving Whispered Speech Recognition Performance using Pseudo-whispered based Data Augmentation2023 · 8 cites

Normalizing Flow based Hidden Markov Models for Classification of Speech Phones with Explainability2021 · 4 cites

Complex Recurrent Variational Autoencoder with Application to Speech Enhancement2022 · 3 cites

Foster Strengths and Circumvent Weaknesses: a Speech Enhancement Framework with Two-branch Collaborative Learning2021 · 2 cites

Representative Subset Selection for Efficient Fine-Tuning in Self-Supervised Speech Recognition2022 · 2 cites

Representation Learning With Hidden Unit Clustering For Low Resource Speech Applications2023 · 2 cites

Unsupervised Domain Adaptation in Speech Recognition using Phonetic Features2021 · 1 cites

Time-frequency Network for Robust Speaker Recognition2023 · 1 cites

Improving Deep Attractor Network by BGRU and GMM for Speech Separation2023 · 1 cites

REBORN: Reinforcement-Learned Boundary Segmentation with Iterative Training for Unsupervised ASR2024 · 1 cites

Tradition or Innovation: A Comparison of Modern ASR Methods for Forced Alignment2024 · 1 cites

Artificial bandwidth extension using deep neural network and $H^\infty$ sampled-data control theory2021

Unsupervised Speech Segmentation and Variable Rate Representation Learning using Segmental Contrastive Predictive Coding2021

Noisy Speech Based Temporal Decomposition to Improve Fundamental Frequency Estimation2021

Estimation of speaker age and height from speech signal using bi-encoder transformer mixture model2022

NeuraGen-A Low-Resource Neural Network based approach for Gender Classification2022

Robust Disentangled Variational Speech Representation Learning for Zero-shot Voice Conversion2022

Learning Phone Recognition from Unpaired Audio and Phone Sequences Based on Generative Adversarial Network2022

An Experimental Study on Private Aggregation of Teacher Ensemble Learning for End-to-End Speech Recognition2022

Phoneme Segmentation Using Self-Supervised Speech Models2022

EURO: ESPnet Unsupervised ASR Open-source Toolkit2022

Enhancing Unsupervised Speech Recognition with Diffusion GANs2023

Weakly-supervised forced alignment of disfluent speech using phoneme-level modeling2023

Timestamped Embedding-Matching Acoustic-to-Word CTC ASR2023

PDPCRN: Parallel Dual-Path CRN with Bi-directional Inter-Branch Interactions for Multi-Channel Speech Enhancement2023

Hierarchical Modeling of Spatial Cues via Spherical Harmonics for Multi-Channel Speech Enhancement2023

Efficient Multi-Channel Speech Enhancement with Spherical Harmonics Injection for Directional Encoding2023

Unsupervised Speech Recognition with N-Skipgram and Positional Unigram Matching2023

PhasePerturbation: Speech Data Augmentation via Phase Perturbation for Automatic Speech Recognition2023

On Speech Pre-emphasis as a Simple and Inexpensive Method to Boost Speech Enhancement2024

Leveraging Self-Supervised Models for Automatic Whispered Speech Recognition2024

MaskCycleGAN-based Whisper to Normal Speech Conversion2024

Back to Supervision: Boosting Word Boundary Detection through Frame Classification2024

BEST-STD: Bidirectional Mamba-Enhanced Speech Tokenization for Spoken Term Detection2024

Domain Adaptation and Autoencoder Based Unsupervised Speech Enhancement2021

Disentangled Speech Representation Learning Based on Factorized Hierarchical Variational Autoencoder with Self-Supervised Objective2022

Quartered Spectral Envelope and 1D-CNN-based Classification of Normally Phonated and Whispered Speech2024