D’Amour, Alexander Nicholas

2 publications

ICML 2024 Transforming and Combining Rewards for Aligning Large Language Models Zihao Wang, Chirag Nagpal, Jonathan Berant, Jacob Eisenstein, Alexander Nicholas D’Amour, Sanmi Koyejo, Victor Veitch

ICML 2023 When Does Privileged Information Explain Away Label Noise? Guillermo Ortiz-Jimenez, Mark Collier, Anant Nawalgaria, Alexander Nicholas D’Amour, Jesse Berent, Rodolphe Jenatton, Efi Kokiopoulou