Wang, Yuhui

14 publications

ICML 2025 Directly Forecasting Belief for Reinforcement Learning with Delays Qingyuan Wu, Yuhui Wang, Simon Sinong Zhan, Yixuan Wang, Chung-Wei Lin, Chen Lv, Qi Zhu, Jürgen Schmidhuber, Chao Huang

ICLR 2025 RobustKV: Defending Large Language Models Against Jailbreak Attacks via KV Eviction Tanqiu Jiang, Zian Wang, Jiacheng Liang, Changjiang Li, Yuhui Wang, Ting Wang

ICML 2025 Scaling Value Iteration Networks to 5000 Layers for Extreme Long-Term Planning Yuhui Wang, Qingyuan Wu, Dylan R. Ashley, Francesco Faccio, Weida Li, Chao Huang, Jürgen Schmidhuber

ICML 2024 Boosting Reinforcement Learning with Strongly Delayed Feedback Through Auxiliary Short Delays Qingyuan Wu, Simon Sinong Zhan, Yixuan Wang, Yuhui Wang, Chung-Wei Lin, Chen Lv, Qi Zhu, Jürgen Schmidhuber, Chao Huang

ICML 2024 Highway Value Iteration Networks Yuhui Wang, Weida Li, Francesco Faccio, Qingyuan Wu, Jürgen Schmidhuber

NeurIPS 2024 Variational Delayed Policy Optimization Qingyuan Wu, Simon Sinong Zhan, Yixuan Wang, Yuhui Wang, Chung-Wei Lin, Chen Lv, Qi Zhu, Chao Huang

ICLR 2023 DropIT: Dropping Intermediate Tensors for Memory-Efficient DNN Training Joya Chen, Kai Xu, Yuhui Wang, Yifei Cheng, Angela Yao

ICCV 2023 Learning to Identify Critical States for Reinforcement Learning from Videos Haozhe Liu, Mingchen Zhuge, Bing Li, Yuhui Wang, Francesco Faccio, Bernard Ghanem, Jürgen Schmidhuber

NeurIPSW 2023 Mindstorms in Natural Language-Based Societies of Mind Mingchen Zhuge, Haozhe Liu, Francesco Faccio, Dylan R. Ashley, Róbert Csordás, Anand Gopalakrishnan, Abdullah Hamdi, Hasan Abed Al Kader Hammoud, Vincent Herrmann, Kazuki Irie, Louis Kirsch, Bing Li, Guohao Li, Shuming Liu, Jinjie Mai, Piotr Piękos, Aditya Ramesh, Imanol Schlag, Weimin Shi, Aleksandar Stanić, Wenyi Wang, Yuhui Wang, Mengmeng Xu, Deng-Ping Fan, Bernard Ghanem, Jürgen Schmidhuber

CVPRW 2023 NTIRE 2023 Challenge on 360° Omnidirectional Image and Video Super-Resolution: Datasets, Methods and Results Mingdeng Cao, Chong Mou, Fanghua Yu, Xintao Wang, Yinqiang Zheng, Jian Zhang, Chao Dong, Gen Li, Ying Shan, Radu Timofte, Xiaopeng Sun, Weiqi Li, Zhenyu Zhang, Xuhan Sheng, Bin Chen, Haoyu Ma, Ming Cheng, Shijie Zhao, Wanwan Cui, Tianyu Xu, Chunyang Li, Long Bao, Heng Sun, Huaibo Huang, Xiaoqiang Zhou, Yuang Ai, Ran He, Renlong Wu, Yi Yang, Zhilu Zhang, Shuohao Zhang, Junyi Li, Yunjin Chen, Dongwei Ren, Wangmeng Zuo, Qian Wang, Hao-Hsiang Yang, Yi-Chung Chen, Zhi-Kai Huang, Wei-Ting Chen, Yuan-Chun Chiang, Hua-En Chang, I-Hsiang Chen, Chia-Hsuan Hsieh, Sy-Yen Kuo, Zebin Zhang, Jiaqi Zhang, Yuhui Wang, Shuhao Cui, Junshi Huang, Li Zhu, Shuman Tian, Wei Yu, Bingchun Luo

AAAI 2021 Deep Recurrent Belief Propagation Network for POMDPs Yuhui Wang, Xiaoyang Tan

AAAI 2020 SMIX(λ): Enhancing Centralized Value Functions for Cooperative Multi-Agent Reinforcement Learning Chao Wen, Xinghu Yao, Yuhui Wang, Xiaoyang Tan

UAI 2019 Truly Proximal Policy Optimization Yuhui Wang, Hao He, Xiaoyang Tan

NeurIPS 2019 Trust Region-Guided Proximal Policy Optimization Yuhui Wang, Hao He, Xiaoyang Tan, Yaozhong Gan