Xiang, Zhen

16 publications

ICML 2025 GuardAgent: Safeguard LLM Agents via Knowledge-Enabled Reasoning Zhen Xiang, Linzhi Zheng, Yanjie Li, Junyuan Hong, Qinbin Li, Han Xie, Jiawei Zhang, Zidi Xiong, Chulin Xie, Carl Yang, Dawn Song, Bo Li

ICLRW 2025 KnowGuard: Robust Reasoning Enabled LLM Guardrail via Knowledge-Enhanced Logical Reasoning Zhen Xiang, Shuang Yang, Nathaniel D. Bastian, Bo Li

ICLR 2025 MMDT: Decoding the Trustworthiness and Safety of Multimodal Foundation Models Chejian Xu, Jiawei Zhang, Zhaorun Chen, Chulin Xie, Mintong Kang, Yujin Potter, Zhun Wang, Zhuowen Yuan, Alexander Xiong, Zidi Xiong, Chenhui Zhang, Lingzhi Yuan, Yi Zeng, Peiyang Xu, Chengquan Guo, Andy Zhou, Jeffrey Ziwei Tan, Xuandong Zhao, Francesco Pinto, Zhen Xiang, Yu Gai, Zinan Lin, Dan Hendrycks, Bo Li, Dawn Song

NeurIPS 2025 Memory Injection Attacks on LLM Agents via Query-Only Interaction Shen Dong, Shaochen Xu, Pengfei He, Yige Li, Jiliang Tang, Tianming Liu, Hui Liu, Zhen Xiang

ICLRW 2025 SafeChain: Safety of Language Models with Long Chain-of-Thought Reasoning Capabilities Fengqing Jiang, Zhangchen Xu, Yuetai Li, Luyao Niu, Zhen Xiang, Bo Li, Bill Yuchen Lin, Radha Poovendran

NeurIPS 2024 AgentPoison: Red-Teaming LLM Agents via Poisoning Memory or Knowledge Bases Zhaorun Chen, Zhen Xiang, Chaowei Xiao, Dawn Song, Bo Li

ICLRW 2024 ArtPrompt: ASCII Art-Based Jailbreak Attacks Against Aligned LLMs Fengqing Jiang, Zhangchen Xu, Luyao Niu, Zhen Xiang, Bhaskar Ramasubramanian, Bo Li, Radha Poovendran

ICLR 2024 BadChain: Backdoor Chain-of-Thought Prompting for Large Language Models Zhen Xiang, Fengqing Jiang, Zidi Xiong, Bhaskar Ramasubramanian, Radha Poovendran, Bo Li

NeurIPS 2024 Data Free Backdoor Attacks Bochuan Cao, Jinyuan Jia, Chuxuan Hu, Wenbo Guo, Zhen Xiang, Jinghui Chen, Bo Li, Dawn Song

NeurIPSW 2024 IDS-Agent: An LLM Agent for Explainable Intrusion Detection in IoT Networks Yanjie Li, Zhen Xiang, Nathaniel D. Bastian, Dawn Song, Bo Li

ICMLW 2024 Physical Backdoor Attack Can Jeopardize Driving with Vision-Large-Language Models Zhenyang Ni, Rui Ye, Yuxi Wei, Zhen Xiang, Yanfeng Wang, Siheng Chen

NeurIPSW 2023 BadChain: Backdoor Chain-of-Thought Prompting for Large Language Models Zhen Xiang, Fengqing Jiang, Zidi Xiong, Bhaskar Ramasubramanian, Radha Poovendran, Bo Li

ICML 2023 UMD: Unsupervised Model Detection for X2X Backdoor Attacks Zhen Xiang, Zidi Xiong, Bo Li

ICLR 2022 Post-Training Detection of Backdoor Attacks for Two-Class and Multi-Attack Scenarios Zhen Xiang, David Miller, George Kesidis

ICCV 2021 A Backdoor Attack Against 3D Point Cloud Classifiers Zhen Xiang, David J. Miller, Siheng Chen, Xi Li, George Kesidis

AISTATS 2009 Speed and Sparsity of Regularized Boosting Yongxin Xi, Zhen Xiang, Peter Ramadge, Robert Schapire