← authors · overview

Renjie Pi

13 papers · 775 citations

Most-cited papers

Mitigating The Alignment Tax Of RLHF
2023 · 166 citations
Mllm-protector: Ensuring Mllm's Safety Without Hurting Performance
2024 · 118 citations
LISA: Layerwise Importance Sampling For Memory-efficient Large Language Model Fine-tuning
2024 · 106 citations
Gradsafe: Detecting Jailbreak Prompts For Llms Via Safety-critical Gradient Analysis
2024 · 95 citations
Strengthening Multimodal Large Language Model With Bootstrapped Preference Optimization
2024 · 86 citations

Topics

Fine-Tuning Training Techniques Safety & Alignment Vision-Language Efficiency Reinforcement Learning Prompting Evaluation Model Architecture