Bae, Juhan

16 publications

ICLR 2025 Accelerating Neural Network Training: An Analysis of the AlgoPerf Competition Priya Kasimbeg, Frank Schneider, Runa Eschenhagen, Juhan Bae, Chandramouli Shama Sastry, Mark Saroufim, Boyuan Feng, Less Wright, Edward Z. Yang, Zachary Nado, Sourabh Medapati, Philipp Hennig, Michael Rabbat, George E. Dahl

NeurIPS 2025 Better Training Data Attribution via Better Inverse Hessian-Vector Products Andrew Wang, Elisa Nguyen, Runshi Yang, Juhan Bae, Sheila A. McIlraith, Roger Baker Grosse

NeurIPS 2025 IF-Guide: Influence Function-Guided Detoxification of LLMs Zachary Coalson, Juhan Bae, Nicholas Carlini, Sanghyun Hong

ICLR 2025 Influence Functions for Scalable Data Attribution in Diffusion Models Bruno Kacper Mlodozeniec, Runa Eschenhagen, Juhan Bae, Alexander Immer, David Krueger, Richard E. Turner

ICLR 2025 Procedural Knowledge in Pretraining Drives Reasoning in Large Language Models Laura Ruis, Maximilian Mozes, Juhan Bae, Siddhartha Rao Kamalakara, Dwaraknath Gnaneshwar, Acyr Locatelli, Robert Kirk, Tim Rocktäschel, Edward Grefenstette, Max Bartolo

NeurIPS 2025 What Is Your Data Worth to GPT? LLM-Scale Data Valuation with Influence Functions Sang Keun Choe, Hwijeen Ahn, Juhan Bae, Kewen Zhao, Youngseog Chung, Adithya Pratapa, Willie Neiswanger, Emma Strubell, Teruko Mitamura, Jeff Schneider, Eduard Hovy, Roger Baker Grosse, Eric P. Xing

ICML 2024 Can We Remove the Square-Root in Adaptive Gradient Methods? a Second-Order Perspective Wu Lin, Felix Dangel, Runa Eschenhagen, Juhan Bae, Richard E. Turner, Alireza Makhzani

NeurIPS 2024 Training Data Attribution via Approximate Unrolling Juhan Bae, Wu Lin, Jonathan Lorraine, Roger Grosse

ICML 2023 Efficient Parametric Approximations of Neural Network Function Space Distance Nikita Dhawan, Sicong Huang, Juhan Bae, Roger Baker Grosse

ICLR 2023 Multi-Rate VAE: Train Once, Get the Full Rate-Distortion Curve Juhan Bae, Michael R. Zhang, Michael Ruan, Eric Wang, So Hasegawa, Jimmy Ba, Roger Baker Grosse

NeurIPSW 2023 Using Large Language Models for Hyperparameter Optimization Michael R. Zhang, Nishkrit Desai, Juhan Bae, Jonathan Lorraine, Jimmy Ba

NeurIPS 2022 Amortized Proximal Optimization Juhan Bae, Paul Vicol, Jeff Z. HaoChen, Roger B Grosse

NeurIPS 2022 If Influence Functions Are the Answer, Then What Is the Question? Juhan Bae, Nathan Ng, Alston Lo, Marzyeh Ghassemi, Roger B Grosse

ICML 2021 On Monotonic Linear Interpolation of Neural Network Parameters James R Lucas, Juhan Bae, Michael R Zhang, Stanislav Fort, Richard Zemel, Roger B Grosse

NeurIPS 2020 Delta-STN: Efficient Bilevel Optimization for Neural Networks Using Structured Response Jacobians Juhan Bae, Roger B Grosse

ECCVW 2018 Learnable Pooling Methods for Video Classification Sebastian Kmiec, Juhan Bae, Ruijian An