Awesome Speech Audio

📄Papers 🧭Topics 🔥Trending 🗺️Map 🏆Leaderboards 🎓Learn 🤖Ask AI

⋯More

👥Authors 📚Reading Packs 📊Datasets 🛠️Tools 📰News 📝Blogs ✉️Newsletter 🎯Research Radar 🔖Saved

← authors · overview

Loading author…

Stay Updated

E-Mail Digest 🎯 Research Radar

Submit a paper · Privacy · Terms

© 2026 Awesome Papers.

Zhongyuan Wang — most-cited papers & profile · Speech Audio

← authors · overview

Zhongyuan Wang

30 papers · 191 citations · 30 h-index

Nanjing Agricultural University · Chengdu University of Traditional Chinese Medicine

Google Scholar ↗Semantic Scholar ↗OpenAlex ↗

Most-cited papers

Agentic Reinforced Policy Optimization
2025 · 94 citations
Agentic Reinforced Policy Optimization
2025 · 94 citations
Robobench: A Comprehensive Evaluation Benchmark for Multimodal Large Language Models as Embodied Brain
2025 · 1 citations
AffordGrasp: In-Context Affordance Reasoning for Open-Vocabulary Task-Oriented Grasping in Clutter
2025 · 1 citations
Uni-NaVid: A Video-based Vision-Language-Action Model for Unifying Embodied Navigation Tasks
2024 · 1 citations
Emu3.5: Native Multimodal Models are World Learners
2025
OmniUMI: Towards Physically Grounded Robot Learning via Human-Aligned Multimodal Interaction
2026
SaPaVe: Towards Active Perception and Manipulation in Vision-Language-Action Models for Robotics
2026
PRM-as-a-Judge: A Dense Evaluation Paradigm for Fine-Grained Robotic Auditing
2026
Latent Reasoning VLA: Latent Thinking and Prediction for Vision-Language-Action Models
2026

Reshaping Action Error Distributions for Reliable Vision-Language-Action Models

2026

RoboBrain 2.5: Depth in Sight, Time in Mind

2026

Towards Spatial Trace with Reasoning in Vision-Language Models for Robotics

2025

RoboTracer: Mastering Spatial Trace with Reasoning in Vision-Language Models for Robotics

2025

Robo-Dopamine: General Process Reward Modeling for High-Precision Robotic Manipulation

2025

Topics

Control Manipulation Perception Multi-Robot Human-Robot Interaction Navigation Multi-Agent Benchmarks Vision-Language Models Embodied & Agents