Pelrine, Kellin

17 publications

ICLRW 2025 A Guide to Misinformation Detection Data and Evaluation Camille Thibault, Jacob-Junqi Tian, Gabrielle Péloquin-Skulski, Taylor Lynn Curtis, James Zhou, Florence Laflamme, Yuxiang Guan, Reihaneh Rabbany, Jean-François Godbout, Kellin Pelrine

AAAI 2025 Can Go AIs Be Adversarially Robust? Tom Tseng, Euan McLean, Kellin Pelrine, Tony Tong Wang, Adam Gleave

ICLRW 2025 From Intuition to Understanding: Using AI Peers to Overcome Physics Misconceptions Ruben Weijers, Denton Wu, Hannah Betts, Tamara Jacod, Yuxiang Guan, Vidya Sujaya, Kushal Dev, William Delooze, Reihaneh Rabbany, Ying Wu, Jean-François Godbout, Kellin Pelrine

ICLRW 2025 From Intuition to Understanding: Using AI Peers to Overcome Physics Misconceptions Ruben Weijers, Denton Wu, Hannah Betts, Tamara Jacod, Yuxiang Guan, Vidya Sujaya, Kushal Dev, Toshali Goel, William Delooze, Reihaneh Rabbany, Ying Wu, Jean-François Godbout, Kellin Pelrine

ICLRW 2025 Rethinking Anti-Misinformation AI Vidya Sujaya, Kellin Pelrine, Andreea Musulan, Reihaneh Rabbany

IJCAI 2025 SandboxSocial: A Sandbox for Social Media Using Multimodal AI Agents Maximilian Puelma Touzel, Sneheel Sarangi, Gayatri Krishnakumar, Busra Tugce Gurbuz, Austin Welch, Zachary Yang, Andreea Musulan, Hao Yu, Ethan Kosak-Hine, Tom Gibbs, Camille Thibault, Reihaneh Rabbany, Jean-François Godbout, Dan Zhao, Kellin Pelrine

AAAI 2025 Scaling Trends for Data Poisoning in LLMs Dillon Bowen, Brendan Murphy, Will Cai, David Khachaturov, Adam Gleave, Kellin Pelrine

IJCAI 2025 Veracity: An Open-Source AI Fact-Checking System Taylor Lynn Curtis, Maximilian Puelma Touzel, William Garneau, Manon Gruaz, Mike Pinder, Li Wei Wang, Sukanya Krishna, Luda Cohen, Jean-François Godbout, Reihaneh Rabbany, Kellin Pelrine

ICMLW 2024 Can Go AIs Be Adversarially Robust? Tom Tseng, Euan McLean, Kellin Pelrine, Tony Tong Wang, Adam Gleave

NeurIPSW 2024 Decompose, Recompose, and Conquer: Multi-Modal LLMs Are Vulnerable to Compositional Adversarial Attacks in Multi-Image Queries Julius Broomfield, George Ingebretsen, Reihaneh Iranmanesh, Sara Pieri, Ethan Kosak-Hine, Tom Gibbs, Reihaneh Rabbany, Kellin Pelrine

NeurIPSW 2024 Decompose, Recompose, and Conquer: Multi-Modal LLMs Are Vulnerable to Compositional Adversarial Attacks in Multi-Image Queries Julius Broomfield, George Ingebretsen, Reihaneh Iranmanesh, Sara Pieri, Ethan Kosak-Hine, Tom Gibbs, Reihaneh Rabbany, Kellin Pelrine

NeurIPSW 2024 Epistemic Integrity in Large Language Models Bijean Ghafouri, Shahrad Mohammadzadeh, James Zhou, Pratheeksha Nair, Jacob-Junqi Tian, Mayank Goel, Reihaneh Rabbany, Jean-François Godbout, Kellin Pelrine

NeurIPSW 2024 Simulation System Towards Solving Societal-Scale Manipulation Maximilian Puelma Touzel, Sneheel Sarangi, Austin Welch, Gayatri K, Dan Zhao, Zachary Yang, Hao Yu, Tom Gibbs, Ethan Kosak-Hine, Andreea Musulan, Camille Thibault, Busra Tugce Gurbuz, Reihaneh Rabbany, Jean-François Godbout, Kellin Pelrine

NeurIPSW 2024 Simulation System Towards Solving Societal-Scale Manipulation Maximilian Puelma Touzel, Sneheel Sarangi, Austin Welch, Gayatri K, Dan Zhao, Zachary Yang, Hao Yu, Tom Gibbs, Ethan Kosak-Hine, Andreea Musulan, Camille Thibault, Reihaneh Rabbany, Jean-François Godbout, Kellin Pelrine

NeurIPSW 2024 The Structural Safety Generalization Problem Tom Gibbs, Julius Broomfield, George Ingebretsen, Ethan Kosak-Hine, Tia Nasir, Jason Zhang, Reihaneh Iranmanesh, Sara Pieri, Reihaneh Rabbany, Kellin Pelrine

ICML 2023 Adversarial Policies Beat Superhuman Go AIs Tony Tong Wang, Adam Gleave, Tom Tseng, Kellin Pelrine, Nora Belrose, Joseph Miller, Michael D Dennis, Yawen Duan, Viktor Pogrebniak, Sergey Levine, Stuart Russell

NeurIPS 2022 Towards Better Evaluation for Dynamic Link Prediction Farimah Poursafaei, Shenyang Huang, Kellin Pelrine, Reihaneh Rabbany