← all datasets

Qwen

Emerging

11papers using it

2025first seen

🔎 Find this dataset

Papers using Qwen (11)

EdgeRazor: A Lightweight Framework for Large Language Models via Mixed-Precision Quantization-Aware Distillation2026

ReMoE: Boosting Expert Reuse through Router Fine-Tuning in Memory-Constrained MoE LLM Inference2026

Reasoning-preserved Efficient Distillation of Large Language Models via Activation-aware Initialization2026

GAMMA: Global Bit Allocation for Mixed-Precision Models under Arbitrary Budgets2026

Access Sets Matter: Budgeting Expert Reads for Scalable Weight-Space Model Merging2026

NIRVANA: Structured pruning reimagined for large language models compression2025

Chunks as Arms: Multi-Armed Bandit-Guided Sampling for Long-Context LLM Preference Optimization2025

TransMLA: Multi-head Latent Attention Is All You Need2025

ARMOR: High-Performance Semi-Structured Pruning via Adaptive Matrix Factorization2025

Accelerating Large Language Model Reasoning via Speculative Search2025

LoRASuite: Efficient LoRA Adaptation Across Large Language Model Upgrades2025

Qwen — datasets — llm-papers