Zhao, Wanjia

9 publications

ICLR 2025 DeepSeek-Prover-V1.5: Harnessing Proof Assistant Feedback for Reinforcement Learning and Monte-Carlo Tree Search Huajian Xin, Z.Z. Ren, Junxiao Song, Zhihong Shao, Wanjia Zhao, Haocheng Wang, Bo Liu, Liyue Zhang, Xuan Lu, Qiushi Du, Wenjun Gao, Haowei Zhang, Qihao Zhu, Dejian Yang, Zhibin Gou, Z.F. Wu, Fuli Luo, Chong Ruan

NeurIPS 2025 Don’t Forget the Enjoin: FocalLoRA for Instruction Hierarchical Alignment in Large Language Models Zitong Shi, Guancheng Wan, Haixin Wang, Ruoyan Li, Zijie Huang, Wanjia Zhao, Yijia Xiao, Xiao Luo, Carl Yang, Yizhou Sun, Wei Wang

NeurIPS 2025 GeoAda: Efficiently Finetune Geometric Diffusion Models with Equivariant Adapters Wanjia Zhao, Jiaqi Han, Siyi Gu, Mingjian Jiang, James Zou, Stefano Ermon

ICML 2025 Rethink GraphODE Generalization Within Coupled Dynamical System Guancheng Wan, Zijie Huang, Wanjia Zhao, Xiao Luo, Yizhou Sun, Wei Wang

NeurIPS 2025 SiriuS: Self-Improving Multi-Agent Systems via Bootstrapped Reasoning Wanjia Zhao, Mert Yuksekgonul, Shirley Wu, James Zou

ICLRW 2025 SiriuS: Self-Improving Multi-Agent Systems via Bootstrapped Reasoning Wanjia Zhao, Mert Yuksekgonul, Shirley Wu, James Zou

NeurIPS 2024 Physics-Informed Regularization for Domain-Agnostic Dynamical System Modeling Zijie Huang, Wanjia Zhao, Jingdong Gao, Ziniu Hu, Xiao Luo, Yadi Cao, Yuanzhou Chen, Yizhou Sun, Wei Wang

AAAI 2023 Positive Distribution Pollution: Rethinking Positive Unlabeled Learning from a Unified Perspective Qianqiao Liang, Mengying Zhu, Yan Wang, Xiuyuan Wang, Wanjia Zhao, Mengyuan Yang, Hua Wei, Bing Han, Xiaolin Zheng

NeurIPSW 2023 TANGO: Time-Reversal Latent GraphODE for Multi-Agent Dynamical Systems Zijie Huang, Wanjia Zhao, Jingdong Gao, Ziniu Hu, Xiao Luo, Yadi Cao, Yuanzhou Chen, Yizhou Sun, Wei Wang