← authors · overview

Li Yuan

19 papers · 5 citations

Most-cited papers

Tokens-to-token Vit: Training Vision Transformers From Scratch On Imagenet
2021 · 2247 citations
LLM Lies: Hallucinations Are Not Bugs, But Features As Adversarial Examples
2023 · 296 citations
VOLO: Vision Outlooker For Visual Recognition
2021 · 269 citations
LOOK-M: Look-once Optimization In KV Cache For Efficient Multimodal Long-context Inference
2024 · 84 citations
Viewcrafter: Taming Video Diffusion Models For High-fidelity Novel View Synthesis
2024 · 50 citations
Collaborative Multi-lora Experts With Achievement-based Multi-tasks Loss For Unified Multimodal Information Extraction
2025 · 3 citations
Does Understanding Inform Generation In Unified Multimodal Models? From Analysis To Path Forward
2025

Topics

3D Vision Vision-Language Models Safety & Alignment Evaluation Training Techniques Efficiency In-Context Learning Vision-Language Model Architecture Image Generation