Awesome Speech Audio

📄Papers 🧭Topics 🔥Trending 🗺️Map 🏆Leaderboards 🎓Learn 🤖Ask AI

⋯More

👥Authors 📚Reading Packs 📊Datasets 🛠️Tools 📰News 📝Blogs ✉️Newsletter 🎯Research Radar 🔖Saved

← authors · overview

Loading author…

Stay Updated

E-Mail Digest 🎯 Research Radar

Submit a paper · Privacy · Terms

© 2026 Awesome Papers.

Song Han — most-cited papers & profile · Speech Audio

← authors · overview

Song Han

21 papers · 81 citations · 59 h-index

Boston University · Northeastern University · Nvidia (United Kingdom) · Yanshan University · IIT@MIT · Massachusetts Institute of Technology · Universidad del Noreste

Google Scholar ↗Semantic Scholar ↗OpenAlex ↗

Most-cited papers

Efficient and Robust LiDAR-Based End-to-End Navigation
2021 · 46 citations
CoT-VLA: Visual Chain-of-Thought Reasoning for Vision-Language-Action Models
2025 · 29 citations
QeRL: Beyond Efficiency -- Quantization-enhanced Reinforcement Learning for LLMs
2025 · 4 citations
Variational Quantum Pulse Learning
2022 · 1 citations
BitDelta: Your Fine-Tune May Only Be Worth One Bit
2024 · 1 citations
SANA-Video 2.0: Hybrid Linear Attention with Attention Residuals for Efficient Video Generation
2026
Cosmos 3: Omnimodal World Models for Physical AI
2026
Cosmos 3: Omnimodal World Models for Physical AI
2026
Lightning OPD: Efficient Post-Training for Large Reasoning Models with Offline On-Policy Distillation
2026
ForeAct: Steering Your VLA with Efficient Visual Foresight Planning

2026

VLASH: Real-Time VLAs via Future-State-Aware Asynchronous Inference

2025

DC-AE 1.5: Accelerating Diffusion Model Convergence with Structured Latent Space

2025

EgoVLA: Learning Vision-Language-Action Models from Egocentric Human Videos

2025

SparseLoRA: Accelerating LLM Fine-Tuning with Contextual Sparsity

2025

QeRL: Beyond Efficiency -- Quantization-enhanced Reinforcement Learning for LLMs

2025

Topics

Control Manipulation Fine-Tuning Efficiency Training Techniques Human-Robot Interaction In-Context Learning Benchmarks Navigation Image Generation