Zhang, Zhiwei

32 publications

ICLR 2026 Bradley-Terry and Multi-Objective Reward Modeling Are Complementary Zhiwei Zhang, Hui Liu, Xiaomin Li, Zhenwei Dai, Jingying Zeng, Fali Wang, Minhua Lin, Ramraj Chandradevan, Linlin Wu, Zhen Li, Chen Luo, Zongyu Wu, Xianfeng Tang, Qi He, Suhang Wang

ICLR 2026 How Far Are LLMs from Professional Poker Players? Revisiting Game-Theoretic Reasoning with Agentic Tool Use Minhua Lin, Enyan Dai, Hui Liu, Xianfeng Tang, Yuliang Yan, Zhenwei Dai, Jingying Zeng, Zhiwei Zhang, Fali Wang, Hongcheng Gao, Chen Luo, Xiang Zhang, Qi He, Suhang Wang

ICLR 2026 LoC-Decomp: LLM Autoformalization via Logical Concept Decomposition and Iterative Feedback Correction Jiangze Shi, Zhiwei Zhang, Baoquan Ma, Shuai Zhao, Ye Yuan, Guoren Wang

ICLR 2026 Multi-Head Low-Rank Attention Songtao Liu, Hongwu Peng, Zhiwei Zhang, Zhengyu Chen, Yue Guo

ICLR 2026 Multiplayer Nash Preference Optimization Fang Wu, Xu Huang, Weihao Xuan, Zhiwei Zhang, Yijia Xiao, Guancheng Wan, Xiaomin Li, Bing Hu, Peng Xia, Jure Leskovec, Yejin Choi

ICLR 2026 Unlocking the Power of Multi-Agent LLM for Reasoning: From Lazy Agents to Deliberation Zhiwei Zhang, Xiaomin Li, Yudi Lin, Hui Liu, Ramraj Chandradevan, Linlin Wu, Minhua Lin, Fali Wang, Xianfeng Tang, Qi He, Suhang Wang

NeurIPS 2025 AgentTTS: Large Language Model Agent for Test-Time Compute-Optimal Scaling Strategy in Complex Tasks Fali Wang, Hui Liu, Zhenwei Dai, Jingying Zeng, Zhiwei Zhang, Zongyu Wu, Chen Luo, Zhen Li, Xianfeng Tang, Qi He, Suhang Wang

ECML-PKDD 2025 Backdoor Attacks on Graph Classification via Data Augmentation and Dynamic Poisoning Yadong Wang, Zhiwei Zhang, Pengpeng Qiao, Ye Yuan, Guoren Wang

NeurIPS 2025 Can Large Multimodal Models Understand Agricultural Scenes? Benchmarking with AgroMind Qingmei Li, Yang Zhang, Zurong Mai, Yuhang Chen, Shuohong Lou, Henglian Huang, Jiarui Zhang, Zhiwei Zhang, Yibin Wen, Weijia Li, Haohuan Fu, Huang Jianxi, Juepeng Zheng

ICLR 2025 Catastrophic Failure of LLM Unlearning via Quantization Zhiwei Zhang, Fali Wang, Xiaomin Li, Zongyu Wu, Xianfeng Tang, Hui Liu, Qi He, Wenpeng Yin, Suhang Wang

ICLRW 2025 Data-Adaptive Safety Rules for Training Reward Models Xiaomin Li, Mingye Gao, Zhiwei Zhang, Jingxuan Fan, Weiyu Li

NeurIPS 2025 GTPBD: A Fine-Grained Global Terraced Parcel and Boundary Dataset Zhiwei Zhang, Zi Ye, Yibin Wen, Shuai Yuan, Haohuan Fu, Huang Jianxi, Juepeng Zheng

AAAI 2025 Massively Parallel Continuous Local Search for Hybrid SAT Solving on GPUs Yunuo Cen, Zhiwei Zhang, Xuanyao Fong

ICLR 2025 Robustness Inspired Graph Backdoor Defense Zhiwei Zhang, Minhua Lin, Junjie Xu, Zongyu Wu, Enyan Dai, Suhang Wang

ICLRW 2025 Rule-Based Rating and Selection of LLM Training Data Xiaomin Li, Mingye Gao, Zhiwei Zhang, Chang Yue, Hong Hu

ICML 2025 RuleAdapter: Dynamic Rules for Training Safety Reward Models in RLHF Xiaomin Li, Mingye Gao, Zhiwei Zhang, Jingxuan Fan, Weiyu Li

NeurIPS 2025 VFRTok: Variable Frame Rates Video Tokenizer with Duration-Proportional Information Assumption Tianxiong Zhong, Xingye Tian, Boyuan Jiang, Xuebo Wang, Xin Tao, Pengfei Wan, Zhiwei Zhang

NeurIPS 2025 When Thinking Fails: The Pitfalls of Reasoning for Instruction-Following in LLMs Xiaomin Li, Zhou Yu, Zhiwei Zhang, Xupeng Chen, Ziji Zhang, Yingying Zhuang, Narayanan Sadagopan, Anurag Beniwal

TMLR 2024 Accountable Textual-Visual Chat Learns to Reject Human Instructions in Image Re-Creation Zhiwei Zhang, Yuliang Liu

ICML 2024 Efficient Contrastive Learning for Fast and Accurate Inference on Graphs Teng Xiao, Huaisheng Zhu, Zhiwei Zhang, Zhimeng Guo, Charu C. Aggarwal, Suhang Wang, Vasant G Honavar

ICML 2024 Efficient Denoising Diffusion via Probabilistic Masking Weizhong Zhang, Zhiwei Zhang, Renjie Pi, Zhongming Jin, Yuan Gao, Jieping Ye, Kani Chen

NeurIPSW 2024 Extralonger: Toward a Unified Perspective of Spatial-Temporal Factors for Extra-Long-Term Traffic Forecasting Zhiwei Zhang, Shaojun E, Fandong Meng, Jie Zhou, Wenjuan Han

CVPRW 2024 Monocular 6-DoF Pose Estimation of Spacecrafts Utilizing Self-Iterative Optimization and Motion Consistency Yunfeng Zhang, Linjing You, Luyu Yang, Zhiwei Zhang, Xiangli Nie, Bo Zhang

ICCV 2023 LiDAR-Camera Panoptic Segmentation via Geometry-Consistent and Semantic-Aware Alignment Zhiwei Zhang, Zhizhong Zhang, Qian Yu, Ran Yi, Yuan Xie, Lizhuang Ma

IJCAI 2023 Solving Quantum-Inspired Perfect Matching Problems via Tutte-Theorem-Based Hybrid Boolean Constraints Moshe Y. Vardi, Zhiwei Zhang

ICLR 2022 CoMPS: Continual Meta Policy Search Glen Berseth, Zhiwei Zhang, Grace Zhang, Chelsea Finn, Sergey Levine

NeurIPSW 2021 CoMPS: Continual Meta Policy Search Glen Berseth, Zhiwei Zhang, Grace Zhang, Chelsea Finn, Sergey Levine

AAAI 2021 On Continuous Local BDD-Based Search for Hybrid SAT Solving Anastasios Kyrillidis, Moshe Y. Vardi, Zhiwei Zhang

AAAI 2020 FourierSAT: A Fourier Expansion-Based Algebraic Framework for Solving Hybrid Boolean Constraints Anastasios Kyrillidis, Anshumali Shrivastava, Moshe Y. Vardi, Zhiwei Zhang

IJCAI 2020 P-KDGAN: Progressive Knowledge Distillation with GANs for One-Class Novelty Detection Zhiwei Zhang, Shifeng Chen, Lei Sun

IJCAI 2015 Determining Expert Research Areas with Multi-Instance Learning of Hierarchical Multi-Label Classification Model Tao Wu, Qifan Wang, Zhiwei Zhang, Luo Si

IJCAI 2015 Ranking Preserving Hashing for Fast Similarity Search Qifan Wang, Zhiwei Zhang, Luo Si