← all datasets

Llama

Emerging

14papers using it

2024first seen

🔎 Find this dataset

Papers using Llama (14)

Reasoning-preserved Efficient Distillation of Large Language Models via Activation-aware Initialization2026

GAMMA: Global Bit Allocation for Mixed-Precision Models under Arbitrary Budgets2026

Access Sets Matter: Budgeting Expert Reads for Scalable Weight-Space Model Merging2026

1+1>2: A Synergistic Sparse and Low-Rank Compression Method for Large Language Models2025

Chunks as Arms: Multi-Armed Bandit-Guided Sampling for Long-Context LLM Preference Optimization2025

PhantomHunter: Detecting Unseen Privately-Tuned LLM-Generated Text via Family-Aware Learning2025

TransMLA: Multi-head Latent Attention Is All You Need2025

Quartet: Native FP4 Training Can Be Optimal for Large Language Models2025

Spectral Scaling Laws in Language Models: How Effectively Do Feed-Forward Networks Use Their Latent Space?2025

ARMOR: High-Performance Semi-Structured Pruning via Adaptive Matrix Factorization2025

Accelerating Large Language Model Reasoning via Speculative Search2025

SlimLLM: Accurate Structured Pruning for Large Language Models2025

SlimGPT: Layer-wise Structured Pruning for Large Language Models2024 · 1 cites

DAQ: Density-Aware Post-Training Weight-Only Quantization For LLMs2024

Llama — datasets — llm-papers