DeepSeek-R-1

Emerging

7papers using it

2025first seen

The 'Deepseek R1' dataset/benchmark is used to evaluate the efficiency and effectiveness of various attention mechanisms, including Multi-head Latent Attention (MLA) and Group Query Attention (GQA), in large language models.

🔎 Find this dataset

Papers using DeepSeek-R-1 (7)

TransMLA: Multi-head Latent Attention Is All You Need2025

SWE-RL: Advancing LLM Reasoning via Reinforcement Learning on Open Software Evolution2025

PRIMA.CPP: Speeding Up 70B-Scale LLM Inference on Low-Resource Everyday Home Clusters2025

Learning a Continue-Thinking Token for Enhanced Test-Time Scaling2025

From Harm to Help: Turning Reasoning In-Context Demos into Assets for Reasoning LMs2025

RRTL: Red Teaming Reasoning Large Language Models in Tool Learning2025

Adaptive Rectification Sampling for Test-Time Compute Scaling2025