← all datasets

ADE20K

Canonical

25papers using it

2022first seen

A scene-parsing dataset with dense pixel annotations over 150 semantic categories.

🔎 Find this dataset

Papers using ADE20K (25)

PixCon: Clean-Positive Contrastive Learning for Foundation-Model Semi-Supervised Segmentation2026

Active Spatial Guidance: Eliminating Injected Positional Mechanisms in Vision Transformers2026

LUMA: Benchmarking Segmentation via a Lightweight Universal Mask Adapter2026

Rethinking Depth Pruning for Vision Transformers: A Heterogeneity-Aware Perspective2026

Sparse Attention for Dense Open-Vocabulary Prediction in CLIP2026

Scene-Aware Urban Design: A Human-AI Recommendation Framework Using Co-Occurrence Embeddings and Vision-Language Models2025 · 1 cites

Sub-Semantic Image Segmentation2026

Locality-Attending Vision Transformer2026

Exploring Open-Vocabulary Object Recognition in Images using CLIP2026

Seeing Through Clutter: Structured 3D Scene Reconstruction via Iterative Object Removal2026

DSeq-JEPA: Discriminative Sequential Joint-Embedding Predictive Architecture2025

A Training-Free Framework for Open-Vocabulary Image Segmentation and Recognition with EfficientNet and CLIP2025

Enhancing Transformer-Based Vision Models: Addressing Feature Map Anomalies Through Novel Optimization Strategies2025

The Missing Point in Vision Transformers for Universal Image Segmentation2025

LeMoRe: Learn More Details for Lightweight Semantic Segmentation2025

Cross-Domain Semantic Segmentation with Large Language Model-Assisted Descriptor Generation2025

Conv2Former: A Simple Transformer-Style ConvNet for Visual Recognition2022 · 73 cites

A Unified View of Masked Image Modeling2022 · 14 cites

Decoder Denoising Pretraining for Semantic Segmentation2022 · 10 cites

Understanding Gaussian Attention Bias of Vision Transformers Using Effective Receptive Fields2023 · 7 cites

Feature Selective Transformer for Semantic Image Segmentation2022 · 6 cites

HCFormer: Unified Image Segmentation with Hierarchical Clustering2022 · 3 cites

A Simple Latent Diffusion Approach for Panoptic Segmentation and Mask Inpainting2024 · 3 cites

Low-Resolution Self-Attention for Semantic Segmentation2023 · 2 cites

Transformer Scale Gate for Semantic Segmentation2022