SimplerEnv

Emerging

26papers using it

2025first seen

'SimplerEnv' is a simulation benchmark used to evaluate continuous-action vision-language-action models in various settings, including standard, few-shot, and noisy conditions.

🔎 Find this dataset

Papers using SimplerEnv (26)

VLAFlow: A Unified Training Framework for Vision-Language-Action Models via Co-training and Future Latent Alignment2026

S$^2$-VLA: State-Space Guided Vision-Language-Action Models for Long-Horizon Manipulation2026

OA-WAM: Object-Addressable World Action Model for Robust Robot Manipulation2026

FrameSkip: Learning from Fewer but More Informative Frames in VLA Training2026

IntentVLA: Short-Horizon Intent Modeling for Aliased Robot Manipulation2026

PhysBrain 1.0 Technical Report2026

Spatial Memory for Out-of-Vision Manipulation in Vision-Language-Action2026

StarVLA: A Lego-like Codebase for Vision-Language-Action Model Developing2026

StarVLA-$\alpha$: Reducing Complexity in Vision-Language-Action Systems2026

Disentangled Robot Learning via Separate Forward and Inverse Dynamics Pretraining2026

ReFineVLA: Multimodal Reasoning-Aware Generalist Robotic Policies via Teacher-Guided Fine-Tuning2026

OFlow: Injecting Object-Aware Temporal Flow Matching for Robust Robotic Manipulation2026

Efficient Long-Horizon Vision-Language-Action Models via Static-Dynamic Disentanglement2026

Reshaping Action Error Distributions for Reliable Vision-Language-Action Models2026

ST4VLA: Spatially Guided Training for Vision-Language-Action Models2026

TwinBrainVLA: Unleashing the Potential of Generalist VLMs for Embodied Tasks via Asymmetric Mixture-of-Transformers2026

STARE-VLA: Progressive Stage-Aware Reinforcement for Fine-Tuning Vision-Language-Action Models2025

STORM: Search-Guided Generative World Models for Robotic Manipulation2025

Unifying Perception and Action: A Hybrid-Modality Pipeline with Implicit Visual Chain-of-Thought for Robotic Action Generation2025

ManiAgent: An Agentic Framework for General Robotic Manipulation2025

Embodied-R1: Reinforced Embodied Reasoning for General Robotic Manipulation2025

InstructVLA: Vision-Language-Action Instruction Tuning from Understanding to Manipulation2025

CronusVLA: Towards Efficient and Robust Manipulation via Multi-Frame Vision-Language-Action Modeling2025

TTF-VLA: Temporal Token Fusion Via Pixel-attention Integration For Vision-language-action Models2025

From Seeing to Doing: Bridging Reasoning and Decision for Robotic Manipulation2025

ReBot: Scaling Robot Learning with Real-to-Sim-to-Real Robotic Video Synthesis2025