Xu, Jiahao

19 publications

ICLR 2026 DeepCompress: A Dual Reward Strategy for Dynamically Exploring and Compressing Reasoning Chains Tian Liang, Wenxiang Jiao, Zhiwei He, Jiahao Xu, Haitao Mi, Dong Yu

ICLR 2026 DeepMath-103k: A Large-Scale, Challenging, Decontaminated, and Verifiable Mathematical Dataset for Advancing Reasoning Zhiwei He, Tian Liang, Jiahao Xu, Qiuzhi Liu, Xingyu Chen, Yue Wang, Linfeng Song, Dian Yu, Zhenwen Liang, Wenxuan Wang, Zhuosheng Zhang, Rui Wang, Zhaopeng Tu, Haitao Mi, Dong Yu

ICLR 2026 Heterogeneous Federated Fine-Tuning with Parallel One-Rank Adaptation Zikai Zhang, Rui Hu, Jiahao Xu

ICLR 2026 The End of Manual Decoding: Towards Truly End-to-End Language Models Zhichao Wang, Dongyang Ma, Xinting Huang, Deng Cai, Tian Lan, Jiahao Xu, Haitao Mi, Xiaoying Tang, Yan Wang

ICLR 2026 Traceable Black-Box Watermarks for Federated Learning Jiahao Xu, Rui Hu, Olivera Kotevska, Zikai Zhang

ICLR 2026 WebDevJudge: Evaluating (M)LLMs as Critiques for Web Development Quality Chunyang Li, Yilun Zheng, Xinting Huang, Tianqing Fang, Jiahao Xu, Lihui Chen, Yangqiu Song, Han Hu

WACV 2025 Achieving Byzantine-Resilient Federated Learning via Layer-Adaptive Sparsified Model Aggregation Jiahao Xu, Zikai Zhang, Rui Hu

ICML 2025 Critical Tokens Matter: Token-Level Contrastive Estimation Enhances LLM’s Reasoning Capability Zicheng Lin, Tian Liang, Jiahao Xu, Qiuzhi Liu, Xing Wang, Ruilin Luo, Chufan Shi, Siheng Li, Yujiu Yang, Zhaopeng Tu

WACV 2025 Data-Efficient Alignment in Medical Imaging via Reconfigurable Generative Networks Divya Saxena, Jiannong Cao, Jiahao Xu, Tarun Kulshrestha

CVPR 2025 Detecting Backdoor Attacks in Federated Learning via Direction Alignment Inspection Jiahao Xu, Zikai Zhang, Rui Hu

ICML 2025 Do NOT Think That Much for 2+3=? on the Overthinking of Long Reasoning Models Xingyu Chen, Jiahao Xu, Tian Liang, Zhiwei He, Jianhui Pang, Dian Yu, Linfeng Song, Qiuzhi Liu, Mengfei Zhou, Zhuosheng Zhang, Rui Wang, Zhaopeng Tu, Haitao Mi, Dong Yu

WACV 2025 Identify Backdoored Model in Federated Learning via Individual Unlearning Jiahao Xu, Zikai Zhang, Rui Hu

ICLR 2025 RaSA: Rank-Sharing Low-Rank Adaptation Zhiwei He, Zhaopeng Tu, Xing Wang, Xingyu Chen, Zhijie Wang, Jiahao Xu, Tian Liang, Wenxiang Jiao, Zhuosheng Zhang, Rui Wang

NeurIPS 2025 The First Few Tokens Are All You Need: An Efficient and Effective Unsupervised Prefix Fine-Tuning Method for Reasoning Models Ke Ji, Jiahao Xu, Tian Liang, Qiuzhi Liu, Zhiwei He, Xiaoyuan Liu, Xingyu Chen, Junying Chen, Benyou Wang, Zhaopeng Tu, Haitao Mi, Dong Yu

NeurIPS 2025 Thoughts Are All over the Place: On the Underthinking of Long Reasoning Models Yue Wang, Qiuzhi Liu, Jiahao Xu, Tian Liang, Xingyu Chen, Zhiwei He, Linfeng Song, Dian Yu, Juntao Li, Zhuosheng Zhang, Rui Wang, Zhaopeng Tu, Haitao Mi, Dong Yu

NeurIPS 2025 Trust, but Verify: A Self-Verification Approach to Reinforcement Learning with Verifiable Rewards Xiaoyuan Liu, Tian Liang, Zhiwei He, Jiahao Xu, Wenxuan Wang, Pinjia He, Zhaopeng Tu, Haitao Mi, Dong Yu

NeurIPS 2025 Two Experts Are All You Need for Steering Thinking: Reinforcing Cognitive Effort in MoE Reasoning Models Without Additional Training Mengru Wang, Xingyu Chen, Yue Wang, Zhiwei He, Jiahao Xu, Tian Liang, Qiuzhi Liu, Yunzhi Yao, Wenxuan Wang, Ruotian Ma, Haitao Mi, Ningyu Zhang, Zhaopeng Tu, Xiaolong Li, Dong Yu

AAAI 2024 RG-GAN: Dynamic Regenerative Pruning for Data-Efficient Generative Adversarial Networks Divya Saxena, Jiannong Cao, Jiahao Xu, Tarun Kulshrestha

CVPR 2023 Re-GAN: Data-Efficient GANs Training via Architectural Reconfiguration Divya Saxena, Jiannong Cao, Jiahao Xu, Tarun Kulshrestha