Yang, Xianliang

5 publications

ICLR 2026 Holdout-Loss-Based Data Selection for LLM Finetuning via In-Context Learning Ling Zhang, Xianliang Yang, Juwon Yu, Park Cheonyoung, Lei Song, Jiang Bian

TMLR 2025 Knowing What Not to Do: Leverage Language Model Insights for Action Space Pruning in Multi-Agent Reinforcement Learning Zhihao Liu, Xianliang Yang, Zichuan Liu, Yifan Xia, Wei Jiang, Yuanyu Zhang, Lijuan Li, Guoliang Fan, Lei Song, Jiang Bian

NeurIPS 2025 NaDRO: Leveraging Dual-Reward Strategies for LLMs Training on Noisy Data Haolong Qian, Xianliang Yang, Ling Zhang, Lei Song, Jiang Bian, Chun Yuan

ICML 2024 Position: Rethinking Post-Hoc Search-Based Neural Approaches for Solving Large-Scale Traveling Salesman Problems Yifan Xia, Xianliang Yang, Zichuan Liu, Zhihao Liu, Lei Song, Jiang Bian

ICLR 2024 Whittle Index with Multiple Actions and State Constraint for Inventory Management Chuheng Zhang, Xiangsen Wang, Wei Jiang, Xianliang Yang, Siwei Wang, Lei Song, Jiang Bian