← authors · overview

Himabindu Lakkaraju

12 papers · 863 citations

Most-cited papers

Certifying LLM Safety Against Adversarial Prompting
2023 · 305 citations
In-context Unlearning: Language Models As Few Shot Unlearners
2023 · 212 citations
Faithfulness Vs. Plausibility: On The (un)reliability Of Explanations From Large Language Models
2024 · 107 citations
Follow My Instruction And Spill The Beans: Scalable Data Extraction From Retrieval-augmented Generation Systems
2024 · 63 citations
Quantifying Uncertainty In Natural Language Explanations Of Large Language Models
2023 · 36 citations

Topics

Safety & Alignment Prompting Evaluation In-Context Learning Efficiency Training Techniques RAG