Liang, Zhenkai

5 publications

ICLR 2026 AlphaAlign: Incentivizing Safety Alignment with Extremely Simplified Reinforcement Learning Yi Zhang, An Zhang, XiuYu Zhang, Leheng Sheng, Yuxin Chen, Zhenkai Liang, Xiang Wang

ICLR 2026 AlphaSteer: Learning Refusal Steering with Principled Null-Space Constraint Leheng Sheng, Changshuo Shen, Weixiang Zhao, Junfeng Fang, Xiaohao Liu, Zhenkai Liang, Xiang Wang, An Zhang, Tat-Seng Chua

ICLR 2026 DevOps-Gym: Benchmarking AI Agents in Software DevOps Cycle Yuheng Tang, Kaijie Zhu, Bonan Ruan, Chuqi Zhang, Michael Yang, Hongwei Li, Suyue Guo, Tianneng Shi, Zekun Li, Christopher Kruegel, Giovanni Vigna, Dawn Song, William Yang Wang, Lun Wang, Yangruibo Ding, Zhenkai Liang, Wenbo Guo

NeurIPS 2025 RSafe: Incentivizing Proactive Reasoning to Build Robust and Adaptive LLM Safeguards Jingnan Zheng, Xiangtian Ji, Yijun Lu, Chenhang Cui, Weixiang Zhao, Gelei Deng, Zhenkai Liang, An Zhang, Tat-Seng Chua

CVPR 2025 Your Scale Factors Are My Weapon: Targeted Bit-Flip Attacks on Vision Transformers via Scale Factor Manipulation Jialai Wang, Yuxiao Wu, Weiye Xu, Yating Huang, Chao Zhang, Zongpeng Li, Mingwei Xu, Zhenkai Liang