← authors · overview

Rao Muhammad Anwer

12 papers · 0 citations

Most-cited papers

Terrafm: A Scalable Foundation Model For Unified Multisensor Earth Observation
2025
Ragnet: Large-scale Reasoning-based Affordance Segmentation Benchmark Towards General Grasping
2025
Agent-x: Evaluating Deep Multimodal Reasoning In Vision-centric Agentic Tasks
2025
All In One: Visual-description-guided Unified Point Cloud Segmentation
2025
Think Before You Segment: An Object-aware Reasoning Agent For Referring Audio-visual Segmentation
2025

Topics

Embodied & Agents Vision-Language Models Benchmarks Visual QA & Reasoning Uncategorized Audio-Visual Instruction Tuning