Li, Tianle

14 publications

ICML 2025 AutoEval Done Right: Using Synthetic Data for Model Evaluation Pierre Boyeau, Anastasios Nikolas Angelopoulos, Tianle Li, Nir Yosef, Jitendra Malik, Michael I. Jordan

NeurIPS 2025 FedWMSAM: Fast and Flat Federated Learning via Weighted Momentum and Sharpness-Aware Minimization Tianle Li, Yongzhi Huang, Linshan Jiang, Chang Liu, Qipeng Xie, Wenfeng Du, Lu Wang, Kaishun Wu

ICML 2025 From Crowdsourced Data to High-Quality Benchmarks: Arena-Hard and Benchbuilder Pipeline Tianle Li, Wei-Lin Chiang, Evan Frick, Lisa Dunlap, Tianhao Wu, Banghua Zhu, Joseph E. Gonzalez, Ion Stoica

ICLR 2025 How to Evaluate Reward Models for RLHF Evan Frick, Tianle Li, Connor Chen, Wei-Lin Chiang, Anastasios Nikolas Angelopoulos, Jiantao Jiao, Banghua Zhu, Joseph E. Gonzalez, Ion Stoica

TMLR 2025 Long-Context LLMs Struggle with Long In-Context Learning Tianle Li, Ge Zhang, Quy Duc Do, Xiang Yue, Wenhu Chen

NeurIPS 2025 On the Robustness of Transformers Against Context Hijacking for Linear Classification Tianle Li, Chenyang Zhang, Xingwu Chen, Yuan Cao, Difan Zou

ICML 2025 Prompt-to-Leaderboard: Prompt-Adaptive LLM Evaluations Evan Frick, Connor Chen, Joseph Tennyson, Tianle Li, Wei-Lin Chiang, Anastasios Nikolas Angelopoulos, Ion Stoica

NeurIPS 2025 Unveiling the Compositional Ability Gap in Vision-Language Reasoning Model Tianle Li, Jihai Zhang, Yongming Rao, Yu Cheng

ICML 2024 Chatbot Arena: An Open Platform for Evaluating LLMs by Human Preference Wei-Lin Chiang, Lianmin Zheng, Ying Sheng, Anastasios Nikolas Angelopoulos, Tianle Li, Dacheng Li, Banghua Zhu, Hao Zhang, Michael Jordan, Joseph E. Gonzalez, Ion Stoica

NeurIPS 2024 GenAI Arena: An Open Evaluation Platform for Generative Models Dongfu Jiang, Max Ku, Tianle Li, Yuansheng Ni, Shizhuo Sun, Rongqi Fan, Wenhu Chen

ICLR 2024 ImagenHub: Standardizing the Evaluation of Conditional Image Generation Models Max Ku, Tianle Li, Kai Zhang, Yujie Lu, Xingyu Fu, Wenwen Zhuang, Wenhu Chen

ICLR 2024 LMSYS-Chat-1m: A Large-Scale Real-World LLM Conversation Dataset Lianmin Zheng, Wei-Lin Chiang, Ying Sheng, Tianle Li, Siyuan Zhuang, Zhanghao Wu, Yonghao Zhuang, Zhuohan Li, Zi Lin, Eric Xing, Joseph E. Gonzalez, Ion Stoica, Hao Zhang

NeurIPS 2024 MMLU-Pro: A More Robust and Challenging Multi-Task Language Understanding Benchmark Yubo Wang, Xueguang Ma, Ge Zhang, Yuansheng Ni, Abhranil Chandra, Shiguang Guo, Weiming Ren, Aaran Arulraj, Xuan He, Ziyan Jiang, Tianle Li, Max Ku, Kai Wang, Alex Zhuang, Rongqi Fan, Xiang Yue, Wenhu Chen

TMLR 2023 DreamEdit: Subject-Driven Image Editing Tianle Li, Max Ku, Cong Wei, Wenhu Chen