Awesome Speech Audio

📄Papers 🧭Topics 🔥Trending 🗺️Map 🏆Leaderboards 🎓Learn 🤖Ask AI

⋯More

👥Authors 📚Reading Packs 📊Datasets 🛠️Tools 📰News 📝Blogs ✉️Newsletter 🎯Research Radar 🔖Saved

← authors · overview

Loading author…

Stay Updated

E-Mail Digest 🎯 Research Radar

Submit a paper · Privacy · Terms

© 2026 Awesome Papers.

Lewei Lu — most-cited papers & profile · Speech Audio

← authors · overview

Lewei Lu

13 papers · 1951 citations · 16 h-index

Group Sense (China)

Google Scholar ↗Semantic Scholar ↗OpenAlex ↗

Most-cited papers

MMInstruct: A High-Quality Multi-Modal Instruction Tuning Dataset with Extensive Diversity
2024 · 5 citations
Spatial Preference Rewarding For Mllms Spatial Understanding
2025
VisualPRM: An Effective Process Reward Model for Multimodal Reasoning
2025
VisuLogic: A Benchmark for Evaluating Visual Reasoning in Multi-modal Large Language Models
2025
Enhancing the Reasoning Ability of Multimodal Large Language Models via Mixed Preference Optimization
2024

Topics

Vision-Language Models Instruction Tuning Vision-Language Training Techniques Visual QA & Reasoning Evaluation Model Architecture Audio-Visual Benchmarks Fine-Tuning