Eiras, Francisco

9 publications

ICLR 2025 Do as I Do (Safely): Mitigating Task-Specific Fine-Tuning Risks in Large Language Models Francisco Eiras, Aleksandar Petrov, Philip Torr, M. Pawan Kumar, Adel Bibi

ICLRW 2025 Know Thy Judge: On the Robustness Meta-Evaluation of LLM Safety Judges Francisco Eiras, Eliott Zemour, Eric Lin, Vaikkunth Mugunthan

ICML 2024 Efficient Error Certification for Physics-Informed Neural Networks Francisco Eiras, Adel Bibi, Rudy R Bunel, Krishnamurthy Dj Dvijotham, Philip Torr, M. Pawan Kumar

ICMLW 2024 Mimicking User Data: On Mitigating Fine-Tuning Risks in Closed Large Language Models Francisco Eiras, Aleksandar Petrov, Philip Torr, M. Pawan Kumar, Adel Bibi

ICML 2024 Position: Near to Mid-Term Risks and Opportunities of Open-Source Generative AI Francisco Eiras, Aleksandar Petrov, Bertie Vidgen, Christian Schroeder De Witt, Fabio Pizzati, Katherine Elkins, Supratik Mukhopadhyay, Adel Bibi, Botos Csaba, Fabro Steibel, Fazl Barez, Genevieve Smith, Gianluca Guadagni, Jon Chun, Jordi Cabot, Joseph Marvin Imperial, Juan A. Nolazco-Flores, Lori Landay, Matthew Thomas Jackson, Paul Rottger, Philip Torr, Trevor Darrell, Yong Suk Lee, Jakob Nicolaus Foerster

ECCVW 2024 Segment, Select, Correct: A Framework for Weakly-Supervised Referring Segmentation Francisco Eiras, Kemal Oksuz, Adel Bibi, Philip H. S. Torr, Puneet K. Dokania

ICML 2023 Certifying Ensembles: A General Certification Theory with S-Lipschitzness Aleksandar Petrov, Francisco Eiras, Amartya Sanyal, Philip Torr, Adel Bibi

ICMLW 2023 Certifying Ensembles: A General Certification Theory with S-Lipschitzness Aleksandar Petrov, Francisco Eiras, Amartya Sanyal, Philip Torr, Adel Bibi

TMLR 2022 ANCER: Anisotropic Certification via Sample-Wise Volume Maximization Francisco Eiras, Motasem Alfarra, Philip Torr, M. Pawan Kumar, Puneet K. Dokania, Bernard Ghanem, Adel Bibi