Wu, Zhiyong

28 publications

NeurIPS 2025 E2E-VGuard: Adversarial Prevention for Production LLM-Based End-to-End Speech Synthesis Zhisheng Zhang, Derui Wang, Yifan Mi, Zhiyong Wu, JieGao, Yuxin Cao, Kai Ye, Jason Xue, Jie Hao

ICLR 2025 Implicit Search via Discrete Diffusion: A Study on Chess Jiacheng Ye, Zhenyu Wu, Jiahui Gao, Zhiyong Wu, Xin Jiang, Zhenguo Li, Lingpeng Kong

NeurIPS 2025 LeVo: High-Quality Song Generation with Multi-Preference Alignment Shun Lei, Yaoxun Xu, ZhiweiLin, Huaicheng Zhang, Wei Tan, Hangting Chen, Yixuan Zhang, Chenyu Yang, Haina Zhu, Shuai Wang, Zhiyong Wu, Dong Yu

AAAI 2025 MagicMan: Generative Novel View Synthesis of Humans with 3D-Aware Diffusion and Iterative Refinement Xu He, Zhiyong Wu, Xiaoyu Li, Di Kang, Chaopeng Zhang, Jiangnan Ye, Liyang Chen, Xiangjun Gao, Han Zhang, Haolin Zhuang

ICLR 2025 OS-ATLAS: Foundation Action Model for Generalist GUI Agents Zhiyong Wu, Zhenyu Wu, Fangzhi Xu, Yian Wang, Qiushi Sun, Chengyou Jia, Kanzhi Cheng, Zichen Ding, Liheng Chen, Paul Pu Liang, Yu Qiao

ICLR 2025 RFWave: Multi-Band Rectified Flow for Audio Waveform Reconstruction Peng Liu, Dongyang Dai, Zhiyong Wu

IJCAI 2025 VideoHumanMIB: Unlocking Appearance Decoupling for Video Human Motion In-Betweening Haiwei Xue, Zhensong Zhang, Minglei Li, Zonghong Dai, Fei Yu, Fei Ma, Zhiyong Wu

CVPR 2024 Co-Speech Gesture Video Generation via Motion-Decoupled Diffusion Model Xu He, Qiaochu Huang, Zhensong Zhang, Zhiwei Lin, Zhiyong Wu, Sicheng Yang, Minglei Li, Zhiyi Chen, Songcen Xu, Xiaofei Wu

ICLRW 2024 Corex: Pushing the Boundaries of Complex Reasoning Through Multi-Model Collaboration Qiushi Sun, Zhangyue Yin, Xiang Li, Zhiyong Wu, Xipeng Qiu, Lingpeng Kong

ICLR 2024 Emo: Earth Mover Distance Optimization for Auto-Regressive Language Modeling Siyu Ren, Zhiyong Wu, Kenny Q. Zhu

AAAI 2024 Explore 3D Dance Generation via Reward Model from Automatically-Ranked Demonstrations Zilin Wang, Haolin Zhuang, Lu Li, Yinmin Zhang, Junjie Zhong, Jun Chen, Yu Yang, Boshi Tang, Zhiyong Wu

ICLRW 2024 OS-Copilot: Towards Generalist Computer Agents with Self-Improvement Zhiyong Wu, Chengcheng Han, Zichen Ding, Zhenmin Weng, Zhoumianze Liu, Shunyu Yao, Tao Yu, Lingpeng Kong

AAAI 2024 SECap: Speech Emotion Captioning with Large Language Model Yaoxun Xu, Hangting Chen, Jianwei Yu, Qiaochu Huang, Zhiyong Wu, Shi-Xiong Zhang, Guangzhi Li, Yi Luo, Rongzhi Gu

ICLRW 2024 SeeClick: Harnessing GUI Grounding for Advanced Visual GUI Agents Kanzhi Cheng, Qiushi Sun, Yougang Chu, Fangzhi Xu, Li YanTao, Jianbing Zhang, Zhiyong Wu

AAAI 2024 SimCalib: Graph Neural Network Calibration Based on Similarity Between Nodes Boshi Tang, Zhiyong Wu, Xixin Wu, Qiaochu Huang, Jun Chen, Shun Lei, Helen Meng

NeurIPS 2024 SongCreator: Lyrics-Based Universal Song Generation Shun Lei, Yixuan Zhou, Boshi Tang, Max W. Y. Lam, Feng Liu, Hangyu Liu, Jingcheng Wu, Shiyin Kang, Zhiyong Wu, Helen Meng

ICML 2023 Compositional Exemplars for In-Context Learning Jiacheng Ye, Zhiyong Wu, Jiangtao Feng, Tao Yu, Lingpeng Kong

ICLR 2023 DiffuSeq: Sequence to Sequence Text Generation with Diffusion Models Shansan Gong, Mukai Li, Jiangtao Feng, Zhiyong Wu, Lingpeng Kong

IJCAI 2023 DiffuseStyleGesture: Stylized Audio-Driven Co-Speech Gesture Generation with Diffusion Models Sicheng Yang, Zhiyong Wu, Minglei Li, Zhensong Zhang, Lei Hao, Weihong Bao, Ming Cheng, Long Xiao

CVPR 2023 QPGesture: Quantization-Based and Phase-Guided Motion Matching for Natural Speech-Driven Gesture Generation Sicheng Yang, Zhiyong Wu, Minglei Li, Zhensong Zhang, Lei Hao, Weihong Bao, Haolin Zhuang

ICLR 2023 Self-Guided Noise-Free Data Generation for Efficient Zero-Shot Learning Jiahui Gao, Renjie Pi, Lin Yong, Hang Xu, Jiacheng Ye, Zhiyong Wu, Weizhong Zhang, Xiaodan Liang, Zhenguo Li, Lingpeng Kong

AAAI 2023 Unsupervised Explanation Generation via Correct Instantiations Sijie Cheng, Zhiyong Wu, Jiangjie Chen, Zhixing Li, Yang Liu, Lingpeng Kong

ICCVW 2023 VAST: Vivify Your Talking Avatar via Zero-Shot Expressive Facial Style Transfer Liyang Chen, Zhiyong Wu, Runnan Li, Weihong Bao, Jun Ling, Xu Tan, Sheng Zhao

AAAI 2023 What Does Your Face Sound like? 3D Face Shape Towards Voice Zhihan Yang, Zhiyong Wu, Ying Shan, Jia Jia

AAAI 2021 Inferring Emotion from Large-Scale Internet Voice Data: A Semi-Supervised Curriculum Augmentation Based Deep Learning Approach Suping Zhou, Jia Jia, Zhiyong Wu, Zhihan Yang, Yanfeng Wang, Wei Chen, Fanbo Meng, Shuo Huang, Jialie Shen, Xiaochuan Wang

IJCAI 2019 Towards Discriminative Representation Learning for Speech Emotion Recognition Runnan Li, Zhiyong Wu, Jia Jia, Yaohua Bu, Sheng Zhao, Helen Meng

AAAI 2017 Multi-Task Deep Learning for User Intention Understanding in Speech Interaction Systems Yishuang Ning, Jia Jia, Zhiyong Wu, Runnan Li, Yongsheng An, Yanfeng Wang, Helen M. Meng

IJCAI 2015 Modelling High-Dimensional Sequences with LSTM-RTRBM: Application to Polyphonic Music Generation Qi Lyu, Zhiyong Wu, Jun Zhu, Helen Meng