Tamkin, Alex

13 publications

ICLR 2025 Eliciting Human Preferences with Language Models Belinda Z. Li, Alex Tamkin, Noah Goodman, Jacob Andreas

ICML 2024 Codebook Features: Sparse and Discrete Interpretability for Neural Networks Alex Tamkin, Mohammad Taufeeque, Noah Goodman

NeurIPS 2024 Many-Shot Jailbreaking Cem Anil, Esin Durmus, Nina Panickssery, Mrinank Sharma, Joe Benton, Sandipan Kundu, Joshua Batson, Meg Tong, Jesse Mu, Daniel Ford, Fracesco Mosconi, Rajashree Agrawal, Rylan Schaeffer, Naomi Bashkansky, Samuel Svenningsen, Mike Lambert, Ansh Radhakrishnan, Carson Denison, Evan J Hubinger, Yuntao Bai, Trenton Bricken, Timothy Maxwell, Nicholas Schiefer, James Sully, Alex Tamkin, Tamera Lanhan, Karina Nguyen, Tomasz Korbak, Jared Kaplan, Deep Ganguli, Samuel R. Bowman, Ethan Perez, Roger Baker Grosse, David Duvenaud

NeurIPS 2023 Feature Dropout: Revisiting the Role of Augmentations in Contrastive Learning Alex Tamkin, Margalit Glasgow, Xiluo He, Noah Goodman

CVPRW 2023 Multispectral Contrastive Learning with Viewmaker Networks Jasmine Bayrooti, Noah D. Goodman, Alex Tamkin

NeurIPSW 2023 Social Contract AI: Aligning AI Assistants with Implicit Group Norms Jan-Philipp Fränken, Samuel Kwok, Peixuan Ye, Kanishk Gandhi, Dilip Arumugam, Jared Moore, Alex Tamkin, Tobias Gerstenberg, Noah Goodman

ICLR 2023 Task Ambiguity in Humans and Language Models Alex Tamkin, Kunal Handa, Avash Shrestha, Noah Goodman

NeurIPS 2023 Turbulence in Focus: Benchmarking Scaling Behavior of 3D Volumetric Super-Resolution with BLASTNet 2.0 Data Wai Tong Chung, Bassem Akoush, Pushan Sharma, Alex Tamkin, Ki Sung Jung, Jacqueline Chen, Jack Guo, Davy Brouzet, Mohsen Talei, Bruno Savard, Alexei Poludnenko, Matthias Ihme

NeurIPS 2022 Active Learning Helps Pretrained Models Learn the Intended Task Alex Tamkin, Dat Nguyen, Salil Deshpande, Jesse Mu, Noah Goodman

NeurIPS 2022 DABS 2.0: Improved Datasets and Algorithms for Universal Self-Supervision Alex Tamkin, Gaurab Banerjee, Mohamed Owda, Vincent Liu, Shashank Rammoorthy, Noah Goodman

ICLR 2021 Viewmaker Networks: Learning Views for Unsupervised Representation Learning Alex Tamkin, Mike Wu, Noah Goodman

AAAI 2020 Being Optimistic to Be Conservative: Quickly Learning a CVaR Policy Ramtin Keramati, Christoph Dann, Alex Tamkin, Emma Brunskill

NeurIPS 2020 Language Through a Prism: A Spectral Approach for Multiscale Language Representations Alex Tamkin, Dan Jurafsky, Noah Goodman