Shen, Sheng

25 publications

ICLR 2024 AgentBench: Evaluating LLMs as Agents Xiao Liu, Hao Yu, Hanchen Zhang, Yifan Xu, Xuanyu Lei, Hanyu Lai, Yu Gu, Hangliang Ding, Kaiwen Men, Kejuan Yang, Shudan Zhang, Xiang Deng, Aohan Zeng, Zhengxiao Du, Chenhui Zhang, Sheng Shen, Tianjun Zhang, Yu Su, Huan Sun, Minlie Huang, Yuxiao Dong, Jie Tang

IJCAI 2024 Efficient Screen Content Image Compression via Superpixel-Based Content Aggregation and Dynamic Feature Fusion Sheng Shen, Huanjing Yue, Jingyu Yang

NeurIPS 2024 Enhancing Large Vision Language Models with Self-Training on Image Comprehension Yihe Deng, Pan Lu, Fan Yin, Ziniu Hu, Sheng Shen, Quanquan Gu, James Zou, Kai-Wei Chang, Wei Wang

NeurIPS 2024 MINT-1T: Scaling Open-Source Multimodal Data by 10x: A Multimodal Dataset with One Trillion Tokens Anas Awadalla, Le Xue, Oscar Lo, Manli Shu, Hannah Lee, Etash Guha, Matt Jordan, Sheng Shen, Mohamed Awadalla, Silvio Savarese, Caiming Xiong, Ran Xu, Yejin Choi, Ludwig Schmidt

ICLR 2024 Mixture-of-Experts Meets Instruction Tuning: A Winning Combination for Large Language Models Sheng Shen, Le Hou, Yanqi Zhou, Nan Du, Shayne Longpre, Jason Wei, Hyung Won Chung, Barret Zoph, William Fedus, Xinyun Chen, Tu Vu, Yuexin Wu, Wuyang Chen, Albert Webson, Yunxuan Li, Vincent Y Zhao, Hongkun Yu, Kurt Keutzer, Trevor Darrell, Denny Zhou

WACV 2024 Multitask Vision-Language Prompt Tuning Sheng Shen, Shijia Yang, Tianjun Zhang, Bohan Zhai, Joseph E. Gonzalez, Kurt Keutzer, Trevor Darrell

ICML 2024 SqueezeLLM: Dense-and-Sparse Quantization Sehoon Kim, Coleman Richard Charles Hooper, Amir Gholami, Zhen Dong, Xiuyu Li, Sheng Shen, Michael W. Mahoney, Kurt Keutzer

NeurIPSW 2023 AvalonBench: Evaluating LLMs Playing the Game of Avalon Jonathan Light, Min Cai, Sheng Shen, Ziniu Hu

ICCV 2023 Dec-Adapter: Exploring Efficient Decoder-Side Adapter for Bridging Screen Content and Natural Image Compression Sheng Shen, Huanjing Yue, Jingyu Yang

ICLRW 2023 Language Models Are Visual Reasoning Coordinators Liangyu Chen, Bo Li, Sheng Shen, Jingkang Yang, Chunyuan Li, Kurt Keutzer, Trevor Darrell, Ziwei Liu

NeurIPS 2023 Large Language Models Are Visual Reasoning Coordinators Liangyu Chen, Bo Li, Sheng Shen, Jingkang Yang, Chunyuan Li, Kurt Keutzer, Trevor Darrell, Ziwei Liu

ICML 2023 Poisoning Language Models During Instruction Tuning Alexander Wan, Eric Wallace, Sheng Shen, Dan Klein

IJCAI 2023 Towards Robust GAN-Generated Image Detection: A Multi-View Completion Representation Chi Liu, Tianqing Zhu, Sheng Shen, Wanlei Zhou

ICLR 2022 How Much Can CLIP Benefit Vision-and-Language Tasks? Sheng Shen, Liunian Harold Li, Hao Tan, Mohit Bansal, Anna Rohrbach, Kai-Wei Chang, Zhewei Yao, Kurt Keutzer

NeurIPS 2022 K-LITE: Learning Transferable Visual Models with External Knowledge Sheng Shen, Chunyuan Li, Xiaowei Hu, Yujia Xie, Jianwei Yang, Pengchuan Zhang, Zhe Gan, Lijuan Wang, Lu Yuan, Ce Liu, Kurt Keutzer, Trevor Darrell, Anna Rohrbach, Jianfeng Gao

ICLR 2022 Multitask Prompted Training Enables Zero-Shot Task Generalization Victor Sanh, Albert Webson, Colin Raffel, Stephen Bach, Lintang Sutawika, Zaid Alyafeai, Antoine Chaffin, Arnaud Stiegler, Arun Raja, Manan Dey, M Saiful Bari, Canwen Xu, Urmish Thakker, Shanya Sharma Sharma, Eliza Szczechla, Taewoon Kim, Gunjan Chhablani, Nihal Nayak, Debajyoti Datta, Jonathan Chang, Mike Tian-Jian Jiang, Han Wang, Matteo Manica, Sheng Shen, Zheng Xin Yong, Harshit Pandey, Rachel Bawden, Thomas Wang, Trishala Neeraj, Jos Rozen, Abheesht Sharma, Andrea Santilli, Thibault Fevry, Jason Alan Fries, Ryan Teehan, Teven Le Scao, Stella Biderman, Leo Gao, Thomas Wolf, Alexander M Rush

ICML 2022 Staged Training for Transformer Language Models Sheng Shen, Pete Walsh, Kurt Keutzer, Jesse Dodge, Matthew Peters, Iz Beltagy

AAAI 2021 ADAHESSIAN: An Adaptive Second Order Optimizer for Machine Learning Zhewei Yao, Amir Gholami, Sheng Shen, Mustafa Mustafa, Kurt Keutzer, Michael W. Mahoney

ICLR 2021 Discovering Non-Monotonic Autoregressive Orderings with Variational Inference Xuanlin Li, Brandon Trabucco, Dong Huk Park, Michael Luo, Sheng Shen, Trevor Darrell, Yang Gao

NeurIPS 2021 Implicit Transformer Network for Screen Content Image Continuous Super-Resolution Jingyu Yang, Sheng Shen, Huanjing Yue, Kun Li

IJCAI 2020 Emoji-Powered Representation Learning for Cross-Lingual Sentiment Classification (Extended Abstract) Zhenpeng Chen, Sheng Shen, Ziniu Hu, Xuan Lu, Qiaozhu Mei, Xuanzhe Liu

AAAI 2020 On the Generation of Medical Question-Answer Pairs Sheng Shen, Yaliang Li, Nan Du, Xian Wu, Yusheng Xie, Shen Ge, Tao Yang, Kai Wang, Xingzheng Liang, Wei Fan

ICML 2020 PowerNorm: Rethinking Batch Normalization in Transformers Sheng Shen, Zhewei Yao, Amir Gholami, Michael Mahoney, Kurt Keutzer

AAAI 2020 Q-BERT: Hessian Based Ultra Low Precision Quantization of BERT Sheng Shen, Zhen Dong, Jiayu Ye, Linjian Ma, Zhewei Yao, Amir Gholami, Michael W. Mahoney, Kurt Keutzer

ICML 2020 Train Big, Then Compress: Rethinking Model Size for Efficient Training and Inference of Transformers Zhuohan Li, Eric Wallace, Sheng Shen, Kevin Lin, Kurt Keutzer, Dan Klein, Joey Gonzalez