Brauner, Jan M.

3 publications

ICLR 2024 How to Catch an AI Liar: Lie Detection in Black-Box LLMs by Asking Unrelated Questions Lorenzo Pacchiardi, Alex James Chan, Sören Mindermann, Ilan Moscovitz, Alexa Yue Pan, Yarin Gal, Owain Evans, Jan M. Brauner

ICML 2022 Prioritized Training on Points That Are Learnable, Worth Learning, and Not yet Learnt Sören Mindermann, Jan M Brauner, Muhammed T Razzak, Mrinank Sharma, Andreas Kirsch, Winnie Xu, Benedikt Höltgen, Aidan N Gomez, Adrien Morisot, Sebastian Farquhar, Yarin Gal

NeurIPSW 2021 DeDUCE: Generating Counterfactual Explanations at Scale Benedikt Höltgen, Lisa Schut, Jan M. Brauner, Yarin Gal