Du, Nan

33 publications

AAAI 2025 Adapting to Non-Stationary Environments: Multi-Armed Bandit Enhanced Retrieval-Augmented Generation on Knowledge Graphs Xiaqiang Tang, Jian Li, Nan Du, Sihong Xie

ICLR 2025 EC-DIT: Scaling Diffusion Transformers with Adaptive Expert-Choice Routing Haotian Sun, Tao Lei, Bowen Zhang, Yanghao Li, Haoshuo Huang, Ruoming Pang, Bo Dai, Nan Du

ICML 2025 Instruction-Following Pruning for Large Language Models Bairu Hou, Qibin Chen, Jianyu Wang, Guoli Yin, Chong Wang, Nan Du, Ruoming Pang, Shiyu Chang, Tao Lei

ECCV 2024 MM1: Methods, Analysis & Insights from Multimodal LLM Pre-Training Brandon McKinzie, Zhe Gan, Jean-Philippe Fauconnier, Samuel Dodge, Bowen Zhang, Philipp Dufter, Dhruti Shah, Futang Peng, Anton Belyi, Max A Schwarzer, Hongyu Hè, Xianzhi Du, Haotian Zhang, Karanjeet Singh, Doug Kang, Tom Gunter, Xiang Kong, Aonan Zhang, Jianyu Wang, Chong Wang, Nan Du, Tao Lei, Sam Wiseman, Mark Lee, Zirui Wang, Ruoming Pang, Peter Grasch, Alexander Toshev, Yinfei Yang

ICLR 2024 Mixture-of-Experts Meets Instruction Tuning: A Winning Combination for Large Language Models Sheng Shen, Le Hou, Yanqi Zhou, Nan Du, Shayne Longpre, Jason Wei, Hyung Won Chung, Barret Zoph, William Fedus, Xinyun Chen, Tu Vu, Yuexin Wu, Wuyang Chen, Albert Webson, Yunxuan Li, Vincent Y Zhao, Hongkun Yu, Kurt Keutzer, Trevor Darrell, Denny Zhou

NeurIPS 2024 Self-Playing Adversarial Language Game Enhances LLM Reasoning Pengyu Cheng, Yong Dai, Tianhao Hu, Han Xu, Zhisong Zhang, Lei Han, Nan Du, Xiaolong Li

ICML 2023 Brainformers: Trading Simplicity for Efficiency Yanqi Zhou, Nan Du, Yanping Huang, Daiyi Peng, Chang Lan, Da Huang, Siamak Shakeri, David So, Andrew M. Dai, Yifeng Lu, Zhifeng Chen, Quoc V Le, Claire Cui, James Laudon, Jeff Dean

NeurIPS 2023 Conditional Adapters: Parameter-Efficient Transfer Learning with Fast Inference Tao Lei, Junwen Bai, Siddhartha Brahma, Joshua Ainslie, Kenton Lee, Yanqi Zhou, Nan Du, Vincent Zhao, Yuexin Wu, Bo Li, Yu Zhang, Ming-Wei Chang

NeurIPS 2023 DoReMi: Optimizing Data Mixtures Speeds up Language Model Pretraining Sang Michael Xie, Hieu Pham, Xuanyi Dong, Nan Du, Hanxiao Liu, Yifeng Lu, Percy Liang, Quoc V Le, Tengyu Ma, Adams Wei Yu

ICML 2023 Lifelong Language Pretraining with Distribution-Specialized Experts Wuyang Chen, Yanqi Zhou, Nan Du, Yanping Huang, James Laudon, Zhifeng Chen, Claire Cui

JMLR 2023 PaLM: Scaling Language Modeling with Pathways Aakanksha Chowdhery, Sharan Narang, Jacob Devlin, Maarten Bosma, Gaurav Mishra, Adam Roberts, Paul Barham, Hyung Won Chung, Charles Sutton, Sebastian Gehrmann, Parker Schuh, Kensen Shi, Sasha Tsvyashchenko, Joshua Maynez, Abhishek Rao, Parker Barnes, Yi Tay, Noam Shazeer, Vinodkumar Prabhakaran, Emily Reif, Nan Du, Ben Hutchinson, Reiner Pope, James Bradbury, Jacob Austin, Michael Isard, Guy Gur-Ari, Pengcheng Yin, Toju Duke, Anselm Levskaya, Sanjay Ghemawat, Sunipa Dev, Henryk Michalewski, Xavier Garcia, Vedant Misra, Kevin Robinson, Liam Fedus, Denny Zhou, Daphne Ippolito, David Luan, Hyeontaek Lim, Barret Zoph, Alexander Spiridonov, Ryan Sepassi, David Dohan, Shivani Agrawal, Mark Omernick, Andrew M. Dai, Thanumalayan Sankaranarayana Pillai, Marie Pellat, Aitor Lewkowycz, Erica Moreira, Rewon Child, Oleksandr Polozov, Katherine Lee, Zongwei Zhou, Xuezhi Wang, Brennan Saeta, Mark Diaz, Orhan Firat, Michele Catasta, Jason Wei, Kathy Meier-Hellstern, Douglas Eck, Jeff Dean, Slav Petrov, Noah Fiedel

ICLR 2023 ReAct: Synergizing Reasoning and Acting in Language Models Shunyu Yao, Jeffrey Zhao, Dian Yu, Nan Du, Izhak Shafran, Karthik R Narasimhan, Yuan Cao

ICLR 2022 Finetuned Language Models Are Zero-Shot Learners Jason Wei, Maarten Bosma, Vincent Zhao, Kelvin Guu, Adams Wei Yu, Brian Lester, Nan Du, Andrew M. Dai, Quoc V Le

ICML 2022 GLaM: Efficient Scaling of Language Models with Mixture-of-Experts Nan Du, Yanping Huang, Andrew M Dai, Simon Tong, Dmitry Lepikhin, Yuanzhong Xu, Maxim Krikun, Yanqi Zhou, Adams Wei Yu, Orhan Firat, Barret Zoph, Liam Fedus, Maarten P Bosma, Zongwei Zhou, Tao Wang, Emma Wang, Kellie Webster, Marie Pellat, Kevin Robinson, Kathleen Meier-Hellstern, Toju Duke, Lucas Dixon, Kun Zhang, Quoc Le, Yonghui Wu, Zhifeng Chen, Claire Cui

NeurIPS 2022 Mixture-of-Experts with Expert Choice Routing Yanqi Zhou, Tao Lei, Hanxiao Liu, Nan Du, Yanping Huang, Vincent Zhao, Andrew M Dai, Zhifeng Chen, Quoc V Le, James Laudon

IJCAI 2020 Entity Synonym Discovery via Multipiece Bilateral Context Matching Chenwei Zhang, Yaliang Li, Nan Du, Wei Fan, Philip S. Yu

NeurIPS 2020 Learning to Select Best Forecast Tasks for Clinical Outcome Prediction Yuan Xue, Nan Du, Anne Mottram, Martin Seneviratne, Andrew M Dai

AAAI 2020 On the Generation of Medical Question-Answer Pairs Sheng Shen, Yaliang Li, Nan Du, Xian Wu, Yusheng Xie, Shen Ge, Tao Yang, Kai Wang, Xingzheng Liang, Wei Fan

AAAI 2019 Multi-Task Learning with Multi-View Attention for Answer Selection and Knowledge Base Question Answering Yang Deng, Yuexiang Xie, Yaliang Li, Min Yang, Nan Du, Wei Fan, Kai Lei, Ying Shen

NeurIPS 2018 Learning Temporal Point Processes via Reinforcement Learning Shuang Li, Shuai Xiao, Shixiang Zhu, Nan Du, Yao Xie, Le Song

JMLR 2017 Scalable Influence Maximization for Multiple Products in Continuous-Time Diffusion Networks Nan Du, Yingyu Liang, Maria-Florina Balcan, Manuel Gomez-Rodriguez, Hongyuan Zha, Le Song

NeurIPS 2016 Coevolutionary Latent Feature Processes for Continuous-Time User-Item Interactions Yichen Wang, Nan Du, Rakshit Trivedi, Le Song

ICML 2016 Isotonic Hawkes Processes Yichen Wang, Bo Xie, Nan Du, Le Song

AISTATS 2015 Back to the past: Source Identification in Diffusion Networks from Partially Observed Cascades Mehrdad Farajtabar, Manuel Gomez-Rodriguez, Mohammad Zamani, Nan Du, Hongyuan Zha, Le Song

NeurIPS 2015 Time-Sensitive Recommendation from Recurrent User Activities Nan Du, Yichen Wang, Niao He, Jimeng Sun, Le Song

ICML 2014 Influence Function Learning in Information Diffusion Networks Nan Du, Yingyu Liang, Maria Balcan, Le Song

NeurIPS 2014 Learning Time-Varying Coverage Functions Nan Du, Yingyu Liang, Maria-Florina F Balcan, Le Song

NeurIPS 2014 Shaping Social Activity by Incentivizing Users Mehrdad Farajtabar, Nan Du, Manuel Gomez Rodriguez, Isabel Valera, Hongyuan Zha, Le Song

NeurIPS 2013 Scalable Influence Estimation in Continuous-Time Diffusion Networks Nan Du, Le Song, Manuel Gomez Rodriguez, Hongyuan Zha

AISTATS 2013 Uncover Topic-Sensitive Information Diffusion Networks Nan Du, Le Song, Hyenkyun Woo, Hongyuan Zha

NeurIPS 2012 Learning Networks of Heterogeneous Influence Nan Du, Le Song, Ming Yuan, Alex J. Smola

NeurIPS 2012 Waveform Driven Plasticity in BiFeO3 Memristive Devices: Model and Implementation Christian Mayr, Paul Stärke, Johannes Partzsch, Love Cederstroem, Rene Schüffny, Yao Shuai, Nan Du, Heidemarie Schmidt

ECML-PKDD 2010 Analysis of Large Multi-Modal Social Networks: Patterns and a Generator Nan Du, Hao Wang, Christos Faloutsos