R-2R

Emerging

32papers using it

2019first seen

The 'R-2R' dataset is a benchmark used to evaluate Vision-and-Language Navigation (VLN) systems, containing diverse trajectories and instructions derived from real-world indoor environments.

🔎 Find this dataset

Papers using R-2R (32)

PanoGen++: Domain-Adapted Text-Guided Panoramic Environment Generation for Vision-and-Language Navigation2025 · 9 cites

TagaVLM: Topology-Aware Global Action Reasoning for Vision-Language Navigation2026

ProFocus: Proactive Perception and Focused Reasoning in Vision-and-Language Navigation2026

Implicit Geometry Representations for Vision-and-Language Navigation from Web Videos2026

Trajectory-Diversity-Driven Robust Vision-and-Language Navigation2026

Beyond Textual Knowledge-Leveraging Multimodal Knowledge Bases for Enhancing Vision-and-Language Navigation2026

When and How Much to Imagine: Adaptive Test-Time Scaling with World Models for Visual Spatial Reasoning2026

pFedNavi: Structure-Aware Personalized Federated Vision-Language Navigation for Embodied AI2026

Enhancing Vision-Language Navigation with Multimodal Event Knowledge from Real-World Indoor Tour Videos2026

Vision-and-Language Navigation with Analogical Textual Descriptions in LLMs2025

Think Hierarchically, Act Dynamically: Hierarchical Multi-modal Fusion and Reasoning for Vision-and-Language Navigation2025

Fine-Grained Instruction-Guided Graph Reasoning for Vision-and-Language Navigation2025

General Scene Adaptation for Vision-and-Language Navigation2025

A Recurrent Vision-and-Language BERT for Navigation2020 · 40 cites

Vision-and-Language Navigation via Causal Learning2024 · 28 cites

History Aware Multimodal Transformer for Vision-and-Language Navigation2021 · 21 cites

The Road to Know-Where: An Object-and-Room Informed Sequential BERT for Indoor Vision-Language Navigation2021 · 12 cites

HOP: History-and-Order Aware Pre-training for Vision-and-Language Navigation2022 · 8 cites

Neighbor-view Enhanced Model for Vision and Language Navigation2021 · 2 cites

Local Slot Attention for Vision-and-Language Navigation2022 · 2 cites

ESceme: Vision-and-Language Navigation with Episodic Scene Memory2023 · 1 cites

Multimodal Attention Networks for Low-Level Vision-and-Language Navigation2019

VLN-PETL: Parameter-Efficient Transfer Learning for Vision-and-Language Navigation2023

Prompt-based Context- and Domain-aware Pretraining for Vision and Language Navigation2023

DAP: Domain-aware Prompt Learning for Vision-and-Language Navigation2023

NavHint: Vision and Language Navigation Agent with a Hint Generator2024

Causality-based Cross-Modal Representation Learning for Vision-and-Language Navigation2024

DELAN: Dual-Level Alignment for Vision-and-Language Navigation by Cross-Modal Contrastive Learning2024

Why Only Text: Empowering Vision-and-Language Navigation with Multi-modal Prompts2024

Seeing is Believing? Enhancing Vision-Language Navigation using Visual Perturbations2024

NAVCON: A Cognitively Inspired and Linguistically Grounded Corpus for Vision and Language Navigation2024

MAGIC: Meta-Ability Guided Interactive Chain-of-Distillation for Effective-and-Efficient Vision-and-Language Navigation2024