Chen, Weixin

5 publications

NeurIPS 2025 Understanding and Improving Adversarial Robustness of Neural Probabilistic Circuits Weixin Chen, Han Zhao

ICML 2024 GRATH: Gradual Self-Truthifying for Large Language Models Weixin Chen, Dawn Song, Bo Li

NeurIPS 2023 DecodingTrust: A Comprehensive Assessment of Trustworthiness in GPT Models Boxin Wang, Weixin Chen, Hengzhi Pei, Chulin Xie, Mintong Kang, Chenhui Zhang, Chejian Xu, Zidi Xiong, Ritik Dutta, Rylan Schaeffer, Sang Truong, Simran Arora, Mantas Mazeika, Dan Hendrycks, Zinan Lin, Yu Cheng, Sanmi Koyejo, Dawn Song, Bo Li

CVPR 2023 TrojDiff: Trojan Attacks on Diffusion Models with Diverse Targets Weixin Chen, Dawn Song, Bo Li

NeurIPS 2022 Effective Backdoor Defense by Exploiting Sensitivity of Poisoned Samples Weixin Chen, Baoyuan Wu, Haoqian Wang