Subhash, Varshini

3 publications

ICMLW 2023 Why Do Universal Adversarial Attacks Work on Large Language Models?: Geometry Might Be the Answer Varshini Subhash, Anna Bialas, Weiwei Pan, Finale Doshi-Velez

NeurIPSW 2022 What Makes a Good Explanation?: A Harmonized View of Properties of Explanations Varshini Subhash, Zixi Chen, Marton Havasi, Weiwei Pan, Finale Doshi-Velez

NeurIPSW 2022 What Makes a Good Explanation?: A Harmonized View of Properties of Explanations Zixi Chen, Varshini Subhash, Marton Havasi, Weiwei Pan, Finale Doshi-Velez