Zhou, Zhenhong

6 publications

ICLR 2026 DiffuGuard: How Intrinsic Safety Is Lost and Found in Diffusion Large Language Models Zherui Li, Zheng Nie, Zhenhong Zhou, Yue Liu, Yitong Zhang, Yu Cheng, Qingsong Wen, Kun Wang, Yufei Guo, Jiaheng Zhang

ICLR 2026 Goal-Aware Identification and Rectification of Misinformation in Multi-Agent Systems Zherui Li, Yan Mi, Zhenhong Zhou, Houcheng Jiang, Guibin Zhang, Kun Wang, Junfeng Fang

NeurIPS 2025 LIFEBENCH: Evaluating Length Instruction Following in Large Language Models Wei Zhang, Zhenhong Zhou, Kun Wang, Junfeng Fang, Rongwu Xu, Yuanhe Zhang, Rui Wang, Ge Zhang, Xinfeng Li, Li Sun, Lingjuan Lyu, Yang Liu, Sen Su

ICLR 2025 On the Role of Attention Heads in Large Language Model Safety Zhenhong Zhou, Haiyang Yu, Xinghua Zhang, Rongwu Xu, Fei Huang, Kun Wang, Yang Liu, Junfeng Fang, Yongbin Li

ICML 2025 Reinforced Lifelong Editing for Language Models Zherui Li, Houcheng Jiang, Hao Chen, Baolong Bi, Zhenhong Zhou, Fei Sun, Junfeng Fang, Xiang Wang

AAAI 2024 Quantifying and Analyzing Entity-Level Memorization in Large Language Models Zhenhong Zhou, Jiuyang Xiang, Chaomeng Chen, Sen Su