Awesome Speech Audio

📄Papers 🧭Topics 🔥Trending 🗺️Map 🏆Leaderboards 🎓Learn 🤖Ask AI

⋯More

👥Authors 📚Reading Packs 📊Datasets 🛠️Tools 📰News 📝Blogs ✉️Newsletter 🎯Research Radar 🔖Saved

← authors · overview

Loading author…

Stay Updated

E-Mail Digest 🎯 Research Radar

Submit a paper · Privacy · Terms

© 2026 Awesome Papers.

Xing Sun — most-cited papers & profile · Speech Audio

← authors · overview

Xing Sun

41 papers · 100 citations · 0 h-index

Tencent (China)

Google Scholar ↗Semantic Scholar ↗OpenAlex ↗

Most-cited papers

VITA-1.5: Towards GPT-4o Level Real-Time Vision and Speech Interaction
2025 · 3 citations
Freeze-Omni: A Smart and Low Latency Speech-to-speech Dialogue Model with Frozen LLM
2024 · 3 citations
DeepOmni: Towards Seamless and Smart Speech Interaction with Adaptive Modality-Specific MoE
2025 · 1 citations
VITA-Audio: Fast Interleaved Cross-Modal Token Generation for Efficient Large Speech-Language Model
2025

Top co-authors

Ke Li · 4 Yunhang Shen · 4 Chaoyou Fu · 3 Zuwei Long · 3 Hang Shao · 2 Haoyu Cao · 2 Long Ma · 2 Rongrong Ji · 2 Xiong Wang · 2 Caifeng Shan · 1 Dong Yang · 1 Haojia Lin · 1

Topics

Text-to-Speech Speech Recognition Multimodal Audio Speech Translation Speech Enhancement cs.CL cs.AI Audio Generation Music Generation