Pan, Minzhou

7 publications

ICLR 2025 AIR-BENCH 2024: A Safety Benchmark Based on Regulation and Policies Specified Risk Categories Yi Zeng, Yu Yang, Andy Zhou, Jeffrey Ziwei Tan, Yuheng Tu, Yifan Mai, Kevin Klyman, Minzhou Pan, Ruoxi Jia, Dawn Song, Percy Liang, Bo Li

NeurIPS 2025 GuardSet-X: Massive Multi-Domain Safety Policy-Grounded Guardrail Dataset Mintong Kang, Zhaorun Chen, Chejian Xu, Jiawei Zhang, Chengquan Guo, Minzhou Pan, Ivan Revilla, Yu Sun, Bo Li

ICML 2025 How to Evaluate and Mitigate IP Infringement in Visual Generative AI? Zhenting Wang, Chen Chen, Vikash Sehwag, Minzhou Pan, Lingjuan Lyu

ICLR 2025 SafeWatch: An Efficient Safety-Policy Following Video Guardrail Model with Transparent Explanations Zhaorun Chen, Francesco Pinto, Minzhou Pan, Bo Li

ICLRW 2025 SafeWatch: An Efficient Safety-Policy Following Video Guardrail Model with Transparent Explanations Zhaorun Chen, Francesco Pinto, Minzhou Pan, Shuang Yang, Bo Li

ECCV 2024 Finding a Needle in a Haystack: A Black-Box Approach to Invisible Watermark Detection Minzhou Pan, Zhenting Wang, Xin Dong, Vikash Sehwag, Lingjuan Lyu, Xue Lin

NeurIPSW 2023 AnchMark: Anchor-Contrastive Watermarking vs GenAI-Based Image Modifications Minzhou Pan, Yi Zeng, Xue Lin, Ning Yu, Cho-Jui Hsieh, Ruoxi Jia