Awesome Speech Audio

📄Papers 🧭Topics 🔥Trending 🗺️Map 🏆Leaderboards 🎓Learn 🤖Ask AI

⋯More

👥Authors 📚Reading Packs 📊Datasets 🛠️Tools 📰News 📝Blogs ✉️Newsletter 🎯Research Radar 🔖Saved

← authors · overview

Loading author…

Stay Updated

E-Mail Digest 🎯 Research Radar

Submit a paper · Privacy · Terms

© 2026 Awesome Papers.

Yixuan Li — most-cited papers & profile · Speech Audio

← authors · overview

Yixuan Li

18 papers · 9 citations · 0 h-index

Shanghai Jiao Tong University · Mila - Quebec Artificial Intelligence Institute · McGill University

Google Scholar ↗Semantic Scholar ↗OpenAlex ↗

Most-cited papers

Is A Picture Worth A Thousand Words? Delving Into Spatial Reasoning for Vision Language Models
2024 · 8 citations
FedEx: Expediting Federated Learning over Heterogeneous Mobile Devices by Overlapping and Participant Selection
2024 · 1 citations
Prism: Efficient Test-Time Scaling via Hierarchical Search and Self-Verification for Discrete Diffusion Language Models
2026
Dual-Granularity Contrastive Reward via Generated Episodic Guidance for Efficient Embodied RL
2026
LessMimic: Long-Horizon Humanoid Interaction with Unified Distance Field Representations
2026
MATAI: A Generalist Machine Learning Framework for Property Prediction and Inverse Design of Advanced Alloys
2025
Learning Human-Humanoid Coordination for Collaborative Object Carrying
2025
QDepth-VLA: Quantized Depth Prediction as Auxiliary Supervision for Vision-Language-Action Models
2025
PseudoBridge: Pseudo Code as the Bridge for Better Semantic and Logic Alignment in Code Retrieval
2025

Move to Understand a 3D Scene: Bridging Visual Grounding and Exploration for Efficient and Versatile Embodied Navigation

2025

Move to Understand a 3D Scene: Bridging Visual Grounding and Exploration for Efficient and Versatile Embodied Navigation

2025

ObjectGS: Object-aware Scene Reconstruction and Scene Understanding via Gaussian Splatting

2025

Autonomous Multi-objective Alloy Design through Simulation-guided Optimization

2025

LUMINA: Detecting Hallucinations in RAG System with Context-Knowledge Signals

2025

Clean First, Align Later: Benchmarking Preference Data Cleaning for Reliable LLM Alignment

2025

Topics

Manipulation Code Models Code Generation Vision-Language Models Visual QA & Reasoning Humanoid Human-Robot Interaction Control Materials Chemistry