Ba, Jimmy

70 publications

ICLR 2024 Identifying the Risks of LM Agents with an LM-Emulated Sandbox Yangjun Ruan, Honghua Dong, Andrew Wang, Silviu Pitis, Yongchao Zhou, Jimmy Ba, Yann Dubois, Chris J. Maddison, Tatsunori Hashimoto

ICLR 2024 OpenWebMath: An Open Dataset of High-Quality Mathematical Web Text Keiran Paster, Marco Dos Santos, Zhangir Azerbayev, Jimmy Ba

NeurIPSW 2024 Report Cards: Qualitative Evaluation of LLMs Using Natural Language Summaries Blair Yang, Fuyang Cui, Keiran Paster, Jimmy Ba, Pashootan Vaezipoor, Silviu Pitis, Michael R. Zhang

ICML 2024 The WMDP Benchmark: Measuring and Reducing Malicious Use with Unlearning Nathaniel Li, Alexander Pan, Anjali Gopal, Summer Yue, Daniel Berrios, Alice Gatti, Justin D. Li, Ann-Kathrin Dombrowski, Shashwat Goel, Gabriel Mukobi, Nathan Helm-Burger, Rassin Lababidi, Lennart Justen, Andrew Bo Liu, Michael Chen, Isabelle Barrass, Oliver Zhang, Xiaoyuan Zhu, Rishub Tamirisa, Bhrugu Bharathi, Ariel Herbert-Voss, Cort B Breuer, Andy Zou, Mantas Mazeika, Zifan Wang, Palash Oswal, Weiran Lin, Adam Alfred Hunt, Justin Tienken-Harder, Kevin Y. Shih, Kemper Talley, John Guan, Ian Steneker, David Campbell, Brad Jokubaitis, Steven Basart, Stephen Fitz, Ponnurangam Kumaraguru, Kallol Krishna Karmakar, Uday Tupakula, Vijay Varadharajan, Yan Shoshitaishvili, Jimmy Ba, Kevin M. Esvelt, Alexandr Wang, Dan Hendrycks

ICMLW 2023 A Generative Model for Text Control in Minecraft Shalev Lifshitz, Keiran Paster, Harris Chan, Jimmy Ba, Sheila A. McIlraith

ICMLW 2023 A Generative Model for Text Control in Minecraft (Abridged Version) Shalev Lifshitz, Keiran Paster, Harris Chan, Jimmy Ba, Sheila A. McIlraith

NeurIPS 2023 AlpacaFarm: A Simulation Framework for Methods That Learn from Human Feedback Yann Dubois, Chen Xuechen Li, Rohan Taori, Tianyi Zhang, Ishaan Gulrajani, Jimmy Ba, Carlos Guestrin, Percy Liang, Tatsunori B Hashimoto

ICMLW 2023 Calibrating Language Models via Augmented Prompt Ensembles Mingjian Jiang, Yangjun Ruan, Sicong Huang, Saifei Liao, Silviu Pitis, Roger Baker Grosse, Jimmy Ba

NeurIPSW 2023 Identifying the Risks of LM Agents with an LM-Emulated Sandbox Yangjun Ruan, Honghua Dong, Andrew Wang, Silviu Pitis, Yongchao Zhou, Jimmy Ba, Yann Dubois, Chris J. Maddison, Tatsunori Hashimoto

ICLR 2023 Large Language Models Are Human-Level Prompt Engineers Yongchao Zhou, Andrei Ioan Muresanu, Ziwen Han, Keiran Paster, Silviu Pitis, Harris Chan, Jimmy Ba

NeurIPS 2023 Learning in the Presence of Low-Dimensional Structure: A Spiked Random Matrix Perspective Jimmy Ba, Murat A Erdogdu, Taiji Suzuki, Zhichao Wang, Denny Wu

ICLR 2023 Multi-Rate VAE: Train Once, Get the Full Rate-Distortion Curve Juhan Bae, Michael R. Zhang, Michael Ruan, Eric Wang, So Hasegawa, Jimmy Ba, Roger Baker Grosse

NeurIPSW 2023 OpenWebMath: An Open Dataset of High-Quality Mathematical Web Text Keiran Paster, Marco Dos Santos, Zhangir Azerbayev, Jimmy Ba

NeurIPS 2023 STEVE-1: A Generative Model for Text-to-Behavior in Minecraft Shalev Lifshitz, Keiran Paster, Harris Chan, Jimmy Ba, Sheila McIlraith

NeurIPSW 2023 STEVE-1: A Generative Model for Text-to-Behavior in Minecraft Shalev Lifshitz, Keiran Paster, Harris Chan, Jimmy Ba, Sheila A. McIlraith

NeurIPSW 2023 STEVE-1: A Generative Model for Text-to-Behavior in Minecraft (Abridged Version) Shalev Lifshitz, Keiran Paster, Harris Chan, Jimmy Ba, Sheila McIlraith

ICML 2023 TR0N: Translator Networks for 0-Shot Plug-and-Play Conditional Generation Zhaoyan Liu, Noël Vouitsis, Satya Krishna Gorti, Jimmy Ba, Gabriel Loaiza-Ganem

NeurIPSW 2023 Using Large Language Models for Hyperparameter Optimization Michael R. Zhang, Nishkrit Desai, Juhan Bae, Jonathan Lorraine, Jimmy Ba

ICMLW 2023 Using Synthetic Data for Data Augmentation to Improve Classification Accuracy Yongchao Zhou, Hshmat Sahak, Jimmy Ba

NeurIPS 2022 Dataset Distillation Using Neural Feature Regression Yongchao Zhou, Ehsan Nezhadarya, Jimmy Ba

NeurIPSW 2022 Guiding Exploration Towards Impactful Actions Vaibhav Saxena, Jimmy Ba, Danijar Hafner

NeurIPS 2022 High-Dimensional Asymptotics of Feature Learning: How One Gradient Step Improves the Representation Jimmy Ba, Murat A Erdogdu, Taiji Suzuki, Zhichao Wang, Denny Wu, Greg Yang

NeurIPSW 2022 Large Language Models Are Human-Level Prompt Engineers Yongchao Zhou, Andrei Ioan Muresanu, Ziwen Han, Keiran Paster, Silviu Pitis, Harris Chan, Jimmy Ba

NeurIPSW 2022 Rational Multi-Objective Agents Must Admit Non-Markov Reward Representations Silviu Pitis, Duncan Bailey, Jimmy Ba

NeurIPSW 2022 Return Augmentation Gives Supervised RL Temporal Compositionality Keiran Paster, Silviu Pitis, Sheila A. McIlraith, Jimmy Ba

NeurIPSW 2022 Steering Large Language Models Using APE Yongchao Zhou, Andrei Ioan Muresanu, Ziwen Han, Keiran Paster, Silviu Pitis, Harris Chan, Jimmy Ba

NeurIPSW 2022 Temporary Goals for Exploration Haoyang Xu, Jimmy Ba, Silviu Pitis, Harris Chan

ICLR 2022 Understanding the Variance Collapse of SVGD in High Dimensions Jimmy Ba, Murat A Erdogdu, Marzyeh Ghassemi, Shengyang Sun, Taiji Suzuki, Denny Wu, Tianzong Zhang

ICMLW 2022 You Can’t Count on Luck: Why Decision Transformers Fail in Stochastic Environments Keiran Paster, Sheila A. McIlraith, Jimmy Ba

NeurIPS 2022 You Can’t Count on Luck: Why Decision Transformers and RvS Fail in Stochastic Environments Keiran Paster, Sheila McIlraith, Jimmy Ba

NeurIPSW 2021 BLAST: Latent Dynamics Models from Bootstrapping Keiran Paster, Lev E McKinney, Sheila A. McIlraith, Jimmy Ba

NeurIPS 2021 Clockwork Variational Autoencoders Vaibhav Saxena, Jimmy Ba, Danijar Hafner

ICML 2021 Efficient Statistical Tests: A Neural Tangent Kernel Approach Sheng Jia, Ehsan Nezhadarya, Yuhuai Wu, Jimmy Ba

NeurIPS 2021 How Does a Neural Network's Architecture Impact Its Robustness to Noisy Labels? Jingling Li, Mozhi Zhang, Keyulu Xu, John Dickerson, Jimmy Ba

ICLR 2021 INT: An Inequality Benchmark for Evaluating Generalization in Theorem Proving Yuhuai Wu, Albert Jiang, Jimmy Ba, Roger Baker Grosse

ICML 2021 LIME: Learning Inductive Bias for Primitives of Mathematical Reasoning Yuhuai Wu, Markus N Rabe, Wenda Li, Jimmy Ba, Roger B Grosse, Christian Szegedy

NeurIPS 2021 Learning Domain Invariant Representations in Goal-Conditioned Block MDPs Beining Han, Chongyi Zheng, Harris Chan, Keiran Paster, Michael Zhang, Jimmy Ba

ICLR 2021 Mastering Atari with Discrete World Models Danijar Hafner, Timothy P Lillicrap, Mohammad Norouzi, Jimmy Ba

ICLR 2021 Planning from Pixels Using Inverse Dynamics Models Keiran Paster, Sheila A. McIlraith, Jimmy Ba

ICLR 2021 When Does Preconditioning Help or Hurt Generalization? Shun-ichi Amari, Jimmy Ba, Roger Baker Grosse, Xuechen Li, Atsushi Nitanda, Taiji Suzuki, Denny Wu, Ji Xu

AISTATS 2020 An Empirical Study of Stochastic Gradient Descent with Structured Covariance Noise Yeming Wen, Kevin Luk, Maxime Gazeau, Guodong Zhang, Harris Chan, Jimmy Ba

ICLR 2020 An Inductive Bias for Distances: Neural Nets That Respect the Triangle Inequality Silviu Pitis, Harris Chan, Kiarash Jamali, Jimmy Ba

ICLR 2020 BatchEnsemble: An Alternative Approach to Efficient Ensemble and Lifelong Learning Yeming Wen, Dustin Tran, Jimmy Ba

ICLR 2020 Dream to Control: Learning Behaviors by Latent Imagination Danijar Hafner, Timothy Lillicrap, Jimmy Ba, Mohammad Norouzi

ICLR 2020 Exploring Model-Based Planning with Policy Networks Tingwu Wang, Jimmy Ba

ICLR 2020 Generalization of Two-Layer Neural Networks: An Asymptotic Viewpoint Jimmy Ba, Murat Erdogdu, Taiji Suzuki, Denny Wu, Tianzong Zhang

ICML 2020 Improving Transformer Optimization Through Better Initialization Xiao Shi Huang, Felipe Perez, Jimmy Ba, Maksims Volkovs

UAI 2020 Learning Intrinsic Rewards as a Bi-Level Optimization Problem Bradly Stadie, Lunjun Zhang, Jimmy Ba

ICML 2020 Maximum Entropy Gain Exploration for Long Horizon Multi-Goal Reinforcement Learning Silviu Pitis, Harris Chan, Stephen Zhao, Bradly Stadie, Jimmy Ba

ICLR 2020 On Solving Minimax Optimization Locally: A Follow-the-Ridge Approach Yuanhao Wang, Guodong Zhang, Jimmy Ba

ICLR 2019 DOM-Q-NET: Grounded RL on Structured Language Sheng Jia, Jamie Ryan Kiros, Jimmy Ba

NeurIPS 2019 Graph Normalizing Flows Jenny Liu, Aviral Kumar, Jimmy Ba, Jamie Kiros, Kevin Swersky

NeurIPS 2019 Lookahead Optimizer: K Steps Forward, 1 Step Back Michael Zhang, James Lucas, Jimmy Ba, Geoffrey E. Hinton

ICLR 2019 Neural Graph Evolution: Towards Efficient Automatic Robot Design Tingwu Wang, Yuhao Zhou, Sanja Fidler, Jimmy Ba

ICLR 2018 Flipout: Efficient Pseudo-Independent Weight Perturbations on Mini-Batches Yeming Wen, Paul Vicol, Jimmy Ba, Dustin Tran, Roger Grosse

ICLR 2018 Kronecker-Factored Curvature Approximations for Recurrent Neural Networks James Martens, Jimmy Ba, Matt Johnson

ICLR 2018 NerveNet: Learning Structured Policy with Graph Neural Networks Tingwu Wang, Renjie Liao, Jimmy Ba, Sanja Fidler

NeurIPS 2018 On the Convergence and Robustness of Training GANs with Regularized Optimal Transport Maziar Sanjabi, Jimmy Ba, Meisam Razaviyayn, Jason Lee

NeurIPS 2018 Reversible Recurrent Neural Networks Matthew MacKay, Paul Vicol, Jimmy Ba, Roger B Grosse

ICLR 2017 Distributed Second-Order Optimization Using Kronecker-Factored Approximations Jimmy Ba, Roger B. Grosse, James Martens

NeurIPS 2017 Scalable Trust-Region Method for Deep Reinforcement Learning Using Kronecker-Factored Approximation Yuhuai Wu, Elman Mansimov, Roger B Grosse, Shun Liao, Jimmy Ba

NeurIPS 2016 Using Fast Weights to Attend to the Recent past Jimmy Ba, Geoffrey E. Hinton, Volodymyr Mnih, Joel Z. Leibo, Catalin Ionescu

ICLR 2015 Adam: A Method for Stochastic Optimization Diederik P. Kingma, Jimmy Ba

NeurIPS 2015 Learning Wake-Sleep Recurrent Attention Models Jimmy Ba, Ruslan Salakhutdinov, Roger B Grosse, Brendan J. Frey

ICLR 2015 Multiple Object Recognition with Visual Attention Jimmy Ba, Volodymyr Mnih, Koray Kavukcuoglu

ICML 2015 Show, Attend and Tell: Neural Image Caption Generation with Visual Attention Kelvin Xu, Jimmy Ba, Ryan Kiros, Kyunghyun Cho, Aaron Courville, Ruslan Salakhudinov, Rich Zemel, Yoshua Bengio

NeurIPS 2014 Do Deep Nets Really Need to Be Deep? Jimmy Ba, Rich Caruana

NeurIPS 2013 Adaptive Dropout for Training Deep Neural Networks Jimmy Ba, Brendan Frey