Cherif, Lynn

4 publications

ICLRW 2025 Cracking the Code of Action: A Generative Approach to Affordances for Reinforcement Learning Lynn Cherif, Flemming Kondrup, David Venuto, Ankit Anand, Doina Precup, Khimya Khetarpal

ICLR 2025 Learning Diverse Attacks on Large Language Models for Robust Red-Teaming and Safety Tuning Seanie Lee, Minsu Kim, Lynn Cherif, David Dobre, Juho Lee, Sung Ju Hwang, Kenji Kawaguchi, Gauthier Gidel, Yoshua Bengio, Nikolay Malkin, Moksh Jain

NeurIPSW 2024 Learning Diverse Attacks on Large Language Models for Robust Red-Teaming and Safety Tuning Seanie Lee, Minsu Kim, Lynn Cherif, David Dobre, Juho Lee, Sung Ju Hwang, Kenji Kawaguchi, Gauthier Gidel, Yoshua Bengio, Nikolay Malkin, Moksh Jain

NeurIPS 2024 Parseval Regularization for Continual Reinforcement Learning Wesley Chung, Lynn Cherif, David Meger, Doina Precup