Anthony, Quentin Gregory

3 publications

TMLR 2024 Simple and Scalable Strategies to Continually Pre-Train Large Language Models Adam Ibrahim, Benjamin Thérien, Kshitij Gupta, Mats Leon Richter, Quentin Gregory Anthony, Eugene Belilovsky, Timothée Lesort, Irina Rish

ICMLW 2023 Continual Pre-Training of Large Language Models: How to Re-Warm Your Model? Kshitij Gupta, Benjamin Thérien, Adam Ibrahim, Mats Leon Richter, Quentin Gregory Anthony, Eugene Belilovsky, Irina Rish, Timothée Lesort

ICML 2023 Pythia: A Suite for Analyzing Large Language Models Across Training and Scaling Stella Biderman, Hailey Schoelkopf, Quentin Gregory Anthony, Herbie Bradley, Kyle O’Brien, Eric Hallahan, Mohammad Aflah Khan, Shivanshu Purohit, Usvsn Sai Prashanth, Edward Raff, Aviya Skowron, Lintang Sutawika, Oskar Van Der Wal