He, Qi

15 publications

ICLR 2026 Bradley-Terry and Multi-Objective Reward Modeling Are Complementary Zhiwei Zhang, Hui Liu, Xiaomin Li, Zhenwei Dai, Jingying Zeng, Fali Wang, Minhua Lin, Ramraj Chandradevan, Linlin Wu, Zhen Li, Chen Luo, Zongyu Wu, Xianfeng Tang, Qi He, Suhang Wang

TMLR 2026 DiffKGW: Stealthy and Robust Diffusion Model Watermarking Tianxin Wei, Ruizhong Qiu, Yifan Chen, Yunzhe Qi, Jiacheng Lin, Wenxuan Bao, Wenju Xu, Sreyashi Nag, Ruirui Li, Hanqing Lu, Zhengyang Wang, Chen Luo, Hui Liu, Suhang Wang, Jingrui He, Qi He, Xianfeng Tang

ICLR 2026 How Far Are LLMs from Professional Poker Players? Revisiting Game-Theoretic Reasoning with Agentic Tool Use Minhua Lin, Enyan Dai, Hui Liu, Xianfeng Tang, Yuliang Yan, Zhenwei Dai, Jingying Zeng, Zhiwei Zhang, Fali Wang, Hongcheng Gao, Chen Luo, Xiang Zhang, Qi He, Suhang Wang

ICLR 2026 Unlocking the Power of Multi-Agent LLM for Reasoning: From Lazy Agents to Deliberation Zhiwei Zhang, Xiaomin Li, Yudi Lin, Hui Liu, Ramraj Chandradevan, Linlin Wu, Minhua Lin, Fali Wang, Xianfeng Tang, Qi He, Suhang Wang

AISTATS 2025 A Theoretical Understanding of Chain-of-Thought: Coherent Reasoning and Error-Aware Demonstration Yingqian Cui, Pengfei He, Xianfeng Tang, Qi He, Chen Luo, Jiliang Tang, Yue Xing

NeurIPS 2025 AgentTTS: Large Language Model Agent for Test-Time Compute-Optimal Scaling Strategy in Complex Tasks Fali Wang, Hui Liu, Zhenwei Dai, Jingying Zeng, Zhiwei Zhang, Zongyu Wu, Chen Luo, Zhen Li, Xianfeng Tang, Qi He, Suhang Wang

CVPRW 2025 Autonomous Multimodal Reasoning via Implicit Chain-of-Vision Yiqiao Huang, Qi He, Zhaorun Chen, Haopeng Zhang, Hanchao Yu, Zhuokai Zhao

NeurIPS 2025 Bilevel ZOFO: Efficient LLM Fine-Tuning and Meta-Training Reza Shirkavand, Peiran Yu, Qi He, Heng Huang

ICLR 2025 Catastrophic Failure of LLM Unlearning via Quantization Zhiwei Zhang, Fali Wang, Xiaomin Li, Zongyu Wu, Xianfeng Tang, Hui Liu, Qi He, Wenpeng Yin, Suhang Wang

ICCV 2025 Dual-Rate Dynamic Teacher for Source-Free Domain Adaptive Object Detection Qi He, Xiao Wu, Jun-Yan He, Shuai Li

NeurIPS 2025 Keeping an Eye on LLM Unlearning: The Hidden Risk and Remedy Jie Ren, Zhenwei Dai, Xianfeng Tang, Yue Xing, Shenglai Zeng, Hui Liu, Jingying Zeng, Qiankun Peng, Samarth Varshney, Suhang Wang, Qi He, Charu C. Aggarwal, Hui Liu

ICLR 2025 MetaDesigner: Advancing Artistic Typography Through AI-Driven, User-Centric, and Multilingual WordArt Synthesis Jun-Yan He, Zhi-Qi Cheng, Chenyang Li, Jingdong Sun, Qi He, Wangmeng Xiang, Hanyuan Chen, Jin-Peng Lan, Xianhui Lin, Kang Zhu, Bin Luo, Yifeng Geng, Xuansong Xie, Alexander G Hauptmann

ICML 2025 Revisiting Convergence: Shuffling Complexity Beyond Lipschitz Smoothness Qi He, Peiran Yu, Ziyi Chen, Heng Huang

NeurIPS 2025 ToolRL: Reward Is All Tool Learning Needs Cheng Qian, Emre Can Acikgoz, Qi He, Hongru Wang, Xiusi Chen, Dilek Hakkani-Tür, Gokhan Tur, Heng Ji

AAAI 2011 Evolution of Node Behavior in Link Prediction Baojun Qiu, Qi He, John Yen