Bhojanapalli, Srinadh

34 publications

ICLR 2025 Arithmetic Transformers Can Length-Generalize in Both Operand Length and Count Hanseul Cho, Jaeyoung Cha, Srinadh Bhojanapalli, Chulhee Yun

ICLRW 2025 Mimetic Initialization Helps State Space Models Learn to Recall Asher Trockman, Hrayr Harutyunyan, J Zico Kolter, Sanjiv Kumar, Srinadh Bhojanapalli

NeurIPS 2025 Scalable In-Context Ranking with Generative Models Nilesh Gupta, Chong You, Srinadh Bhojanapalli, Sanjiv Kumar, Inderjit S Dhillon, Felix X. Yu

NeurIPS 2025 Spark Transformer: Reactivating Sparsity in Transformer FFN and Attention Chong You, Kan Wu, Zhipeng Jia, Lin Chen, Srinadh Bhojanapalli, Jiaxian Guo, Utku Evci, Jan Wassenberg, Praneeth Netrapalli, Jeremiah J. Willcock, Suvinay Subramanian, Felix Chern, Alek Andreev, Shreya Pathak, Felix X. Yu, Prateek Jain, David E Culler, Henry Levy, Sanjiv Kumar

ICLR 2024 Dual-Encoders for Extreme Multi-Label Classification Nilesh Gupta, Fnu Devvrit, Ankit Singh Rawat, Srinadh Bhojanapalli, Prateek Jain, Inderjit S Dhillon

ICLRW 2024 Efficient Language Model Architectures for Differentially Private Federated Learning Jae Hun Ro, Srinadh Bhojanapalli, Zheng Xu, Yanxiang Zhang, Ananda Theertha Suresh

ICLR 2024 Functional Interpolation for Relative Positions Improves Long Context Transformers Shanda Li, Chong You, Guru Guruganesh, Joshua Ainslie, Santiago Ontanon, Manzil Zaheer, Sumit Sanghai, Yiming Yang, Sanjiv Kumar, Srinadh Bhojanapalli

NeurIPS 2024 Position Coupling: Improving Length Generalization of Arithmetic Transformers Using Task Structure Hanseul Cho, Jaeyoung Cha, Pranjal Awasthi, Srinadh Bhojanapalli, Anupam Gupta, Chulhee Yun

ICMLW 2024 Position Coupling: Leveraging Task Structure for Improved Length Generalization of Transformers Hanseul Cho, Jaeyoung Cha, Pranjal Awasthi, Srinadh Bhojanapalli, Anupam Gupta, Chulhee Yun

NeurIPS 2023 On Student-Teacher Deviations in Distillation: Does It Pay to Disobey? Vaishnavh Nagarajan, Aditya K Menon, Srinadh Bhojanapalli, Hossein Mobahi, Sanjiv Kumar

ICLR 2023 The Lazy Neuron Phenomenon: On Emergence of Activation Sparsity in Transformers Zonglin Li, Chong You, Srinadh Bhojanapalli, Daliang Li, Ankit Singh Rawat, Sashank J. Reddi, Ke Ye, Felix Chern, Felix Yu, Ruiqi Guo, Sanjiv Kumar

ICLR 2023 Treeformer: Dense Gradient Trees for Efficient Attention Computation Lovish Madaan, Srinadh Bhojanapalli, Himanshu Jain, Prateek Jain

NeurIPS 2022 On the Adversarial Robustness of Mixture of Experts Joan Puigcerver, Rodolphe Jenatton, Carlos Riquelme, Pranjal Awasthi, Srinadh Bhojanapalli

ICML 2022 Robust Training of Neural Networks Using Scale Invariant Architectures Zhiyuan Li, Srinadh Bhojanapalli, Manzil Zaheer, Sashank Reddi, Sanjiv Kumar

TMLR 2022 Teacher’s Pet: Understanding and Mitigating Biases in Distillation Michal Lukasik, Srinadh Bhojanapalli, Aditya Krishna Menon, Sanjiv Kumar

ICLR 2021 Coping with Label Shift via Distributionally Robust Optimisation Jingzhao Zhang, Aditya Krishna Menon, Andreas Veit, Srinadh Bhojanapalli, Sanjiv Kumar, Suvrit Sra

ICCV 2021 Understanding Robustness of Transformers for Image Classification Srinadh Bhojanapalli, Ayan Chakrabarti, Daniel Glasner, Daliang Li, Thomas Unterthiner, Andreas Veit

NeurIPS 2020 An Efficient Nonconvex Reformulation of Stagewise Convex Optimization Problems Rudy R Bunel, Oliver Hinder, Srinadh Bhojanapalli, Krishnamurthy Dvijotham

ICLR 2020 Are Transformers Universal Approximators of Sequence-to-Sequence Functions? Chulhee Yun, Srinadh Bhojanapalli, Ankit Singh Rawat, Sashank J. Reddi, Sanjiv Kumar

ICML 2020 Does Label Smoothing Mitigate Label Noise? Michal Lukasik, Srinadh Bhojanapalli, Aditya Menon, Sanjiv Kumar

ICLR 2020 Large Batch Optimization for Deep Learning: Training BERT in 76 Minutes Yang You, Jing Li, Sashank Reddi, Jonathan Hseu, Sanjiv Kumar, Srinadh Bhojanapalli, Xiaodan Song, James Demmel, Kurt Keutzer, Cho-Jui Hsieh

ICML 2020 Low-Rank Bottleneck in Multi-Head Attention Models Srinadh Bhojanapalli, Chulhee Yun, Ankit Singh Rawat, Sashank Reddi, Sanjiv Kumar

NeurIPS 2020 O(n) Connections Are Expressive Enough: Universal Approximability of Sparse Transformers Chulhee Yun, Yin-Wen Chang, Srinadh Bhojanapalli, Ankit Singh Rawat, Sashank Reddi, Sanjiv Kumar

ICLR 2019 The Role of Over-Parametrization in Generalization of Neural Networks Behnam Neyshabur, Zhiyuan Li, Srinadh Bhojanapalli, Yann LeCun, Nathan Srebro

ICLR 2018 A PAC-Bayesian Approach to Spectrally-Normalized Margin Bounds for Neural Networks Behnam Neyshabur, Srinadh Bhojanapalli, Nathan Srebro

COLT 2018 Smoothed Analysis for Low-Rank Solutions to Semidefinite Programs in Quadratic Penalty Form Srinadh Bhojanapalli, Nicolas Boumal, Prateek Jain, Praneeth Netrapalli

NeurIPS 2017 Exploring Generalization in Deep Learning Behnam Neyshabur, Srinadh Bhojanapalli, David Mcallester, Nati Srebro

NeurIPS 2017 Implicit Regularization in Matrix Factorization Suriya Gunasekar, Blake E Woodworth, Srinadh Bhojanapalli, Behnam Neyshabur, Nati Srebro

COLT 2016 Dropping Convexity for Faster Semi-Definite Optimization Srinadh Bhojanapalli, Anastasios Kyrillidis, Sujay Sanghavi

NeurIPS 2016 Global Optimality of Local Search for Low Rank Matrix Recovery Srinadh Bhojanapalli, Behnam Neyshabur, Nati Srebro

NeurIPS 2016 Single Pass PCA of Matrix Products Shanshan Wu, Srinadh Bhojanapalli, Sujay Sanghavi, Alexandros G Dimakis

JMLR 2015 Completing Any Low-Rank Matrix, Provably Yudong Chen, Srinadh Bhojanapalli, Sujay Sanghavi, Rachel Ward

ICML 2014 Coherent Matrix Completion Yudong Chen, Srinadh Bhojanapalli, Sujay Sanghavi, Rachel Ward

ICML 2014 Universal Matrix Completion Srinadh Bhojanapalli, Prateek Jain