Sinha, Aradhana

3 publications

ICML 2025 InfAlign: Inference-Aware Language Model Alignment Ananth Balashankar, Ziteng Sun, Jonathan Berant, Jacob Eisenstein, Michael Collins, Adrian Hutter, Jong Lee, Chirag Nagpal, Flavien Prost, Aradhana Sinha, Ananda Theertha Suresh, Ahmad Beirami

TMLR 2024 Break It, Imitate It, Fix It: Robustness by Generating Human-like Attacks Aradhana Sinha, Ananth Balashankar, Ahmad Beirami, Thi Avrahami, Jilin Chen, Alex Beutel

ICLRW 2024 Break It, Imitate It, Fix It: Robustness by Generating Human-like Attacks Aradhana Sinha, Ananth Balashankar, Ahmad Beirami, Thi Avrahami, Jilin Chen, Alex Beutel