Wang, Yibo

28 publications

NeurIPS 2025 Ada-R1: Hybrid-CoT via Bi-Level Adaptive Reasoning Optimization Haotian Luo, Haiying He, Yibo Wang, Jinluan Yang, Rui Liu, Naiqiang Tan, Xiaochun Cao, Dacheng Tao, Li Shen

ICML 2025 Dimension-Free Adaptive Subgradient Methods with Frequent Directions Sifan Yang, Yuanyu Wan, Peijia Li, Yibo Wang, Xiao Zhang, Zhewei Wei, Lijun Zhang

ICLR 2025 KGARevion: An AI Agent for Knowledge-Intensive Biomedical QA Xiaorui Su, Yibo Wang, Shanghua Gao, Xiaolong Liu, Valentina Giunchiglia, Djork-Arné Clevert, Marinka Zitnik

NeurIPS 2025 Mulberry: Empowering MLLM with O1-like Reasoning and Reflection via Collective Monte Carlo Tree Search Huanjin Yao, Jiaxing Huang, Wenhao Wu, Jingyi Zhang, Yibo Wang, Shunyu Liu, Yingjie Wang, YuXin Song, Haocheng Feng, Li Shen, Dacheng Tao

NeurIPS 2025 Panacea: Mitigating Harmful Fine-Tuning for Large Language Models via Post-Fine-Tuning Perturbation Yibo Wang, Tiansheng Huang, Li Shen, Huanjin Yao, Haotian Luo, Rui Liu, Naiqiang Tan, Jiaxing Huang, Dacheng Tao

NeurIPS 2025 R1-ShareVL: Incentivizing Reasoning Capabilities of Multimodal Large Language Models via Share-GRPO Huanjin Yao, Qixiang Yin, Jingyi Zhang, Min Yang, Yibo Wang, Wenhao Wu, Fei Su, Li Shen, Minghui Qiu, Dacheng Tao, Jiaxing Huang

AAAI 2025 Revisiting Projection-Free Online Learning with Time-Varying Constraints Yibo Wang, Yuanyu Wan, Lijun Zhang

NeurIPS 2025 SPACE: Noise Contrastive Estimation Stabilizes Self-Play Fine-Tuning for Large Language Models Yibo Wang, Guangda Huzhang, Qing-Guo Chen, Zhao Xu, Weihua Luo, Kaifu Zhang, Lijun Zhang

AAAI 2025 Towards Unbiased Information Extraction and Adaptation in Cross-Domain Recommendation Yibo Wang, Yingchun Jian, Wenhao Yang, Shiyin Lu, Lei Shen, Bing Wang, Xiaoyi Zeng, Lijun Zhang

NeurIPS 2025 Triplets Better than Pairs: Towards Stable and Effective Self-Play Fine-Tuning for LLMs Yibo Wang, Hai-Long Sun, Guangda Huzhang, Qing-Guo Chen, Zhao Xu, Weihua Luo, Kaifu Zhang, Lijun Zhang

JMLR 2025 Universal Online Convex Optimization Meets Second-Order Bounds Lijun Zhang, Yibo Wang, Guanghui Wang, Jinfeng Yi, Tianbao Yang

NeurIPS 2024 Adaptive Variance Reduction for Stochastic Optimization Under Weaker Assumptions Wei Jiang, Sifan Yang, Yibo Wang, Lijun Zhang

NeurIPS 2024 Advancing Tool-Augmented Large Language Models: Integrating Insights from Errors in Inference Trees Sijia Chen, Yibo Wang, Yi-Feng Wu, Qing-Guo Chen, Zhao Xu, Weihua Luo, Kaifu Zhang, Lijun Zhang

CVPR 2024 DetDiffusion: Synergizing Generative and Perceptive Models for Enhanced Data Generation and Perception Yibo Wang, Ruiyuan Gao, Kai Chen, Kaiqiang Zhou, Yingjie Cai, Lanqing Hong, Zhenguo Li, Lihui Jiang, Dit-Yan Yeung, Qiang Xu, Kai Zhang

ICLR 2024 GeoDiffusion: Text-Prompted Geometric Control for Object Detection Data Generation Kai Chen, Enze Xie, Zhe Chen, Yibo Wang, Lanqing Hong, Zhenguo Li, Dit-Yan Yeung

ECCV 2024 Joint RGB-Spectral Decomposition Model Guided Image Enhancement in Mobile Photography Kailai Zhou, Lijing Cai, Yibo Wang, Mengya Zhang, Bihan Wen, Qiu Shen, Xun Cao

AAAI 2024 Non-Stationary Projection-Free Online Learning with Dynamic and Adaptive Regret Guarantees Yibo Wang, Wenhao Yang, Wei Jiang, Shiyin Lu, Bing Wang, Haihong Tang, Yuanyu Wan, Lijun Zhang

NeurIPS 2024 Online Composite Optimization Between Stochastic and Adversarial Environments Yibo Wang, Sijia Chen, Wei Jiang, Wenhao Yang, Yuanyu Wan, Lijun Zhang

ICML 2024 Projection-Free Variance Reduction Methods for Stochastic Constrained Multi-Level Compositional Optimization Wei Jiang, Sifan Yang, Wenhao Yang, Yibo Wang, Yuanyu Wan, Lijun Zhang

ICML 2024 Small-Loss Adaptive Regret for Online Convex Optimization Wenhao Yang, Wei Jiang, Yibo Wang, Ping Yang, Yao Hu, Lijun Zhang

TMLR 2024 Uncertainty in Graph Neural Networks: A Survey Fangxin Wang, Yuqing Liu, Kay Liu, Yibo Wang, Sourav Medya, Philip S. Yu

NeurIPS 2024 Universal Online Convex Optimization with $1$ Projection per Round Wenhao Yang, Yibo Wang, Peng Zhao, Lijun Zhang

ICCV 2023 Aperture Diffraction for Compact Snapshot Spectral Imaging Tao Lv, Hao Ye, Quan Yuan, Zhan Shi, Yibo Wang, Shuming Wang, Xun Cao

AAAI 2023 Distributed Projection-Free Online Learning for Smooth and Convex Losses Yibo Wang, Yuanyu Wan, Shimao Zhang, Lijun Zhang

NeurIPSW 2023 Probing Explicit and Implicit Gender Bias Through LLM Conditional Text Generation Xiangjue Dong, Yibo Wang, Philip Yu, James Caverlee

CVPR 2022 Explore Spatio-Temporal Aggregation for Insubstantial Object Detection: Benchmark Dataset and Baseline Kailai Zhou, Yibo Wang, Tao Lv, Yunqian Li, Linsen Chen, Qiu Shen, Xun Cao

NeurIPS 2022 Multi-Block-Single-Probe Variance Reduced Estimator for Coupled Compositional Optimization Wei Jiang, Gang Li, Yibo Wang, Lijun Zhang, Tianbao Yang

ICML 2022 Optimal Algorithms for Stochastic Multi-Level Compositional Optimization Wei Jiang, Bokun Wang, Yibo Wang, Lijun Zhang, Tianbao Yang