← authors · overview

Beidi Chen

20 papers · 3184 citations

Most-cited papers

Efficient Streaming Language Models With Attention Sinks
2023 · 1654 citations
Galore: Memory-efficient LLM Training By Gradient Low-rank Projection
2024 · 426 citations
Deja Vu: Contextual Sparsity For Efficient Llms At Inference Time
2023 · 317 citations
Layerskip: Enabling Early Exit Inference And Self-speculative Decoding
2024 · 234 citations
Triforce: Lossless Acceleration Of Long Sequence Generation With Hierarchical Speculative Decoding
2024 · 97 citations

Topics

Efficiency Model Architecture Training Techniques Fine-Tuning In-Context Learning