Cao, Hongye

5 publications

ICLR 2026 SafeDialBench: A Fine-Grained Safety Evaluation Benchmark for Large Language Models in Multi-Turn Dialogues with Diverse Jailbreak Attacks Hongye Cao, Sijia Jing, Yanming Wang, Ziyue Peng, Zhixin Bai, Zhe Cao, Meng Fang, Fan Feng, Jiaheng Liu, Boyan Wang, Tianpei Yang, Jing Huo, Yang Gao, Fanyu Meng, Xi Yang, Chao Deng, Junlan Feng

AAAI 2025 Beyond Mandatory Federations: Balancing Egoism, Utilitarianism and Egalitarianism in Mixed-Motive Games Shaokang Dong, Chao Li, Shangdong Yang, Hongye Cao, Wanqi Yang, Yang Gao

ICLR 2025 Causal Information Prioritization for Efficient Reinforcement Learning Hongye Cao, Fan Feng, Tianpei Yang, Jing Huo, Yang Gao

ICLR 2025 Towards Empowerment Gain Through Causal Structure Learning in Model-Based Reinforcement Learning Hongye Cao, Fan Feng, Meng Fang, Shaokang Dong, Tianpei Yang, Jing Huo, Yang Gao

ICMLW 2024 Towards Empowerment Gain Through Causal Structure Learning in Model-Based RL Hongye Cao, Fan Feng, Meng Fang, Shaokang Dong, Jing Huo, Yang Gao