← authors · overview

Bohan Zeng

10 papers · 0 citations

Most-cited papers

Native Visual Understanding: Resolving Resolution Dilemmas In Vision-language Models
2025
Rethinking Driving World Model As Synthetic Data Generator For Perception Tasks
2025
Scone: Bridging Composition And Distinction In Subject-driven Image Generation Via Unified Understanding-generation Modeling
2025
Diadem: Advancing Dialogue Descriptions In Audiovisual Video Captioning For Multimodal Large Language Models
2026

Topics

Vision-Language Models Benchmarks Video-Language Audio-Visual Uncategorized Visual QA & Reasoning