Nan, Yang

4 publications

ICLR 2026 BAPO: Stabilizing Off-Policy Reinforcement Learning for LLMs via Balanced Policy Optimization with Adaptive Clipping Zhiheng Xi, Xin Guo, Yang Nan, Enyu Zhou, Junrui Shen, Wenxiang Chen, Jiaqi Liu, Jixuan Huang, Xun Deng, Zhihao Zhang, Honglin Guo, Zhikai Lei, Miao Zheng, Guoteng Wang, Peng Sun, Rui Zheng, Hang Yan, Tao Gui, Qi Zhang, Xuanjing Huang

UAI 2025 A Parallel Network for LRCT Segmentation and Uncertainty Mitigation with Fuzzy Sets Shiyi Wang, Yang Nan, Xiaodan Xing, Yingying Fang, Simon Lf Walsh, Guang Yang

NeurIPSW 2024 Deep Generative Models Unveil Patterns in Medical Images Through Vision- “Language” Conditioning Xiaodan Xing, Junzhi Ning, Yang Nan, Guang Yang

IJCAI 2024 Learning Pareto Set for Multi-Objective Continuous Robot Control Tianye Shu, Ke Shang, Cheng Gong, Yang Nan, Hisao Ishibuchi