Zhao, Zhou

129 publications

NeurIPS 2025 AHa-Bench: Benchmarking Audio Hallucinations in Large Audio-Language Models Xize Cheng, Dongjie Fu, Chenyuhao Wen, Shannon Yu, Zehan Wang, Shengpeng Ji, Siddhant Arora, Tao Jin, Shinji Watanabe, Zhou Zhao

NeurIPS 2025 AnomalyCoT: A Multi-Scenario Chain-of-Thought Dataset for Multimodal Large Language Models Jiaxi Cheng, Yuliang Xu, Shoupeng Wang, Ma Tao, Yuchen He, Jinghe Zhang, Sihang Cai, Jiawei Zhen, Jingyi Jia, Yao Wan, Yan Xia, Zhou Zhao

ICCV 2025 Bridging Domain Generalization to Multimodal Domain Generalization via Unified Representations Hai Huang, Yan Xia, Sashuai Zhou, Hanting Wang, Shulei Wang, Zhou Zhao

ICML 2025 CodeSync: Synchronizing Large Language Models with Dynamic Code Evolution at Scale Chenlong Wang, Zhaoyang Chu, Zhengxiang Cheng, Xuyi Yang, Kaiyue Qiu, Yao Wan, Zhou Zhao, Xuanhua Shi, Hai Jin, Dongping Chen

ICML 2025 Dataflow-Guided Neuro-Symbolic Language Models for Type Inference Gen Li, Yao Wan, Hongyu Zhang, Zhou Zhao, Wenbin Jiang, Xuanhua Shi, Hai Jin, Zheng Wang

ICLR 2025 EcoFace: Audio-Visual Emotional Co-Disentanglement Speech-Driven 3D Talking Face Generation Jiajian Xie, Shengyu Zhang, Mengze Li, Chengfei Lv, Zhou Zhao, Fei Wu

IJCAI 2025 ExpTalk: Diverse Emotional Expression via Adaptive Disentanglement and Refined Alignment for Speech-Driven 3D Facial Animation Zhan Qu, Shengyu Zhang, Mengze Li, Zhuo Chen, Chengfei Lv, Zhou Zhao, Fei Wu

CVPR 2025 FADA: Fast Diffusion Avatar Synthesis with Mixed-Supervised Multi-CFG Distillation Tianyun Zhong, Chao Liang, Jianwen Jiang, Gaojie Lin, Jiaqi Yang, Zhou Zhao

NeurIPS 2025 GenSpace: Benchmarking Spatially-Aware Image Generation Zehan Wang, Jiayang Xu, Ziang Zhang, Tianyu Pang, Chao Du, Hengshuang Zhao, Zhou Zhao

ICML 2025 IRBridge: Solving Image Restoration Bridge with Pre-Trained Generative Diffusion Models Hanting Wang, Tao Jin, Wang Lin, Shulei Wang, Hai Huang, Shengpeng Ji, Zhou Zhao

NeurIPS 2025 MRSAudio: A Large-Scale Multimodal Recorded Spatial Audio Dataset with Refined Annotations Wenxiang Guo, Changhao Pan, Zhiyuan Zhu, Xintong Hu, Yu Zhang, Li Tang, Rui Yang, Han Wang, Zongbao Zhang, Yuhan Wang, Yixuan Chen, Hankun Xu, Ke Xu, PengFei Fan, ZheTao Chen, Yanhao Yu, Qiange Huang, Fei Wu, Zhou Zhao

AAAI 2025 MergeNet: Knowledge Migration Across Heterogeneous Models, Tasks, and Modalities Kunxi Li, Tianyu Zhan, Kairui Fu, Shengyu Zhang, Kun Kuang, Jiwei Li, Zhou Zhao, Fan Wu, Fei Wu

CVPR 2025 Non-Natural Image Understanding with Advancing Frequency-Based Vision Encoders Wang Lin, QingSong Wang, Yueying Feng, Shulei Wang, Tao Jin, Zhou Zhao, Fei Wu, Chang Yao, Jingyuan Chen

ICML 2025 OmniAudio: Generating Spatial Audio from 360-Degree Video Huadai Liu, Tianyi Luo, Kaicheng Luo, Qikai Jiang, Peiwen Sun, Jialei Wang, Rongjie Huang, Qian Chen, Wen Wang, Xiangtai Li, Shiliang Zhang, Zhijie Yan, Zhou Zhao, Wei Xue

ICLR 2025 OmniBind: Large-Scale Omni Multimodal Representation via Binding Spaces Zehan Wang, Ziang Zhang, Minjie Hong, Hang Zhang, Luping Liu, Rongjie Huang, Xize Cheng, Shengpeng Ji, Tao Jin, Hengshuang Zhao, Zhou Zhao

ICLR 2025 OmniSep: Unified Omni-Modality Sound Separation with Query-Mixup Xize Cheng, Siqi Zheng, Zehan Wang, Minghui Fang, Ziang Zhang, Rongjie Huang, Shengpeng Ji, Jialong Zuo, Tao Jin, Zhou Zhao

ICCV 2025 Open-Set Cross Modal Generalization via Multimodal Unified Representation Hai Huang, Yan Xia, Shulei Wang, Hanting Wang, Minghui Fang, Shengpeng Ji, Sashuai Zhou, Tao Jin, Zhou Zhao

NeurIPS 2025 Orient Anything V2: Unifying Orientation and Rotation Understanding Zehan Wang, Ziang Zhang, Jiayang Xu, Jialei Wang, Tianyu Pang, Chao Du, Hengshuang Zhao, Zhou Zhao

ICML 2025 Orient Anything: Learning Robust Object Orientation Estimation from Rendering 3D Models Zehan Wang, Ziang Zhang, Tianyu Pang, Chao Du, Hengshuang Zhao, Zhou Zhao

CVPR 2025 RoboGround: Robotic Manipulation with Grounded Vision-Language Priors Haifeng Huang, Xinyi Chen, Yilun Chen, Hao Li, Xiaoshen Han, Zehan Wang, Tai Wang, Jiangmiao Pang, Zhou Zhao

NeurIPS 2025 SPMDM: Enhancing Masked Diffusion Models Through Simplifying Sampling Path Yichen Zhu, Weiyu Chen, James Kwok, Zhou Zhao

NeurIPS 2025 Seeking and Updating with Live Visual Knowledge Mingyang Fu, Yuyang Peng, Dongping Chen, Zetong Zhou, Benlin Liu, Yao Wan, Zhou Zhao, Philip S. Yu, Ranjay Krishna

CVPR 2025 SpatialCLIP: Learning 3D-Aware Image Representations from Spatially Discriminative Language Zehan Wang, Sashuai Zhou, Shaoxuan He, Haifeng Huang, Lihe Yang, Ziang Zhang, Xize Cheng, Shengpeng Ji, Tao Jin, Hengshuang Zhao, Zhou Zhao

AAAI 2025 Speech Watermarking with Discrete Intermediate Representations Shengpeng Ji, Ziyue Jiang, Jialong Zuo, Minghui Fang, Yifu Chen, Tao Jin, Zhou Zhao

AAAI 2025 TechSinger: Technique Controllable Multilingual Singing Voice Synthesis via Flow Matching Wenxiang Guo, Yu Zhang, Changhao Pan, Rongjie Huang, Li Tang, Ruiqi Li, Zhiqing Hong, Yongqi Wang, Zhou Zhao

NeurIPS 2025 ThinkSound: Chain-of-Thought Reasoning in Multimodal LLMs for Audio Generation and Editing Huadai Liu, Kaicheng Luo, Jialei Wang, Wen Wang, Qian Chen, Zhou Zhao, Wei Xue

CVPR 2025 Towards Transformer-Based Aligned Generation with Self-Coherence Guidance Shulei Wang, Wang Lin, Hai Huang, Hanting Wang, Sihang Cai, WenKang Han, Tao Jin, Jingyuan Chen, Jiacheng Sun, Jieming Zhu, Zhou Zhao

NeurIPS 2025 Vinci: Deep Thinking in Text-to-Image Generation Using Unified Model with Reinforcement Learning Wang Lin, Wentao Hu, Liyu Jia, Kaihang Pan, Zhang Majun, Zhou Zhao, Fei Wu, Jingyuan Chen, Hanwang Zhang

ICLR 2025 VoxDialogue: Can Spoken Dialogue Systems Understand Information Beyond Words? Xize Cheng, Ruofan Hu, Xiaoda Yang, Jingyu Lu, Dongjie Fu, Zehan Wang, Shengpeng Ji, Rongjie Huang, Boyang Zhang, Tao Jin, Zhou Zhao

ICLR 2025 WavTokenizer: An Efficient Acoustic Discrete Codec Tokenizer for Audio Language Modeling Shengpeng Ji, Ziyue Jiang, Wen Wang, Yifu Chen, Minghui Fang, Jialong Zuo, Qian Yang, Xize Cheng, Zehan Wang, Ruiqi Li, Ziang Zhang, Xiaoda Yang, Rongjie Huang, Yidi Jiang, Qian Chen, Siqi Zheng, Zhou Zhao

NeurIPS 2024 $e^3$: Exploring Embodied Emotion Through a Large-Scale Egocentric Video Dataset Wang Lin, Yueying Feng, Wenkang Han, Tao Jin, Zhou Zhao, Fei Wu, Chang Yao, Jingyuan Chen

NeurIPS 2024 Action Imitation in Common Action Space for Customized Action Image Synthesis Wang Lin, Jingyuan Chen, Jiaxin Shi, Zirun Guo, Yichen Zhu, Zehan Wang, Tao Jin, Zhou Zhao, Fei Wu, Shuicheng Yan, Hanwang Zhang

AAAI 2024 AudioGPT: Understanding and Generating Speech, Music, Sound, and Talking Head Rongjie Huang, Mingze Li, Dongchao Yang, Jiatong Shi, Xuankai Chang, Zhenhui Ye, Yuning Wu, Zhiqing Hong, Jiawei Huang, Jinglin Liu, Yi Ren, Yuexian Zou, Zhou Zhao, Shinji Watanabe

NeurIPS 2024 Chat-Scene: Bridging 3D Scene and Large Language Models with Object Identifiers Haifeng Huang, Yilun Chen, Zehan Wang, Rongjie Huang, Runsen Xu, Tai Wang, Luping Liu, Xize Cheng, Yang Zhao, Jiangmiao Pang, Zhou Zhao

NeurIPS 2024 Classifier-Guided Gradient Modulation for Enhanced Multimodal Learning Zirun Guo, Tao Jin, Jingyuan Chen, Zhou Zhao

NeurIPS 2024 Extending Multi-Modal Contrastive Representations Ziang Zhang, Zehan Wang, Luping Liu, Rongjie Huang, Xize Cheng, Zhenhui Ye, Wang Lin, Huadai Liu, Haifeng Huang, Yang Zhao, Tao Jin, Siqi Zheng, Zhou Zhao

ICML 2024 FreeBind: Free Lunch in Unified Multimodal Space via Knowledge Fusion Zehan Wang, Ziang Zhang, Xize Cheng, Rongjie Huang, Luping Liu, Zhenhui Ye, Haifeng Huang, Yang Zhao, Tao Jin, Peng Gao, Zhou Zhao

NeurIPS 2024 Frieren: Efficient Video-to-Audio Generation Network with Rectified Flow Matching Yongqi Wang, Wenxiang Guo, Rongjie Huang, Jiawei Huang, Zehan Wang, Fuming You, Ruiqi Li, Zhou Zhao

NeurIPS 2024 GTSinger: A Global Multi-Technique Singing Corpus with Realistic Music Scores for All Singing Tasks Yu Zhang, Changhao Pan, Wenxiang Guo, Ruiqi Li, Zhiyuan Zhu, Jialei Wang, Wenhao Xu, Jingyu Lu, Zhiqing Hong, Chuxin Wang, LiChao Zhang, Jinzheng He, Ziyue Jiang, Yuxin Chen, Chen Yang, Jiecheng Zhou, Xinyu Cheng, Zhou Zhao

ICML 2024 InstructSpeech: Following Speech Editing Instructions via Large Language Models Rongjie Huang, Ruofan Hu, Yongqi Wang, Zehan Wang, Xize Cheng, Ziyue Jiang, Zhenhui Ye, Dongchao Yang, Luping Liu, Peng Gao, Zhou Zhao

CVPR 2024 MPOD123: One Image to 3D Content Generation Using Mask-Enhanced Progressive Outline-to-Detail Optimization Jimin Xu, Tianbao Wang, Tao Jin, Shengyu Zhang, Dongjie Fu, Zhe Wang, Jiangjing Lyu, Chengfei Lv, Chaoyue Niu, Zhou Yu, Zhou Zhao, Fei Wu

ICLR 2024 Mega-TTS 2: Boosting Prompting Mechanisms for Zero-Shot Speech Synthesis Ziyue Jiang, Jinglin Liu, Yi Ren, Jinzheng He, Zhenhui Ye, Shengpeng Ji, Qian Yang, Chen Zhang, Pengfei Wei, Chunfeng Wang, Xiang Yin, Zejun Ma, Zhou Zhao

NeurIPS 2024 MimicTalk: Mimicking a Personalized and Expressive 3D Talking Face in Minutes Zhenhui Ye, Tianyun Zhong, Yi Ren, Ziyue Jiang, Jiawei Huang, Rongjie Huang, Jinglin Liu, Jinzheng He, Chen Zhang, Zehan Wang, Xize Chen, Xiang Yin, Zhou Zhao

NeurIPS 2024 MoMu-Diffusion: On Learning Long-Term Motion-Music Synchronization and Correspondence Fuming You, Minghui Fang, Li Tang, Rongjie Huang, Yongqi Wang, Zhou Zhao

ICML 2024 Non-Confusing Generation of Customized Concepts in Diffusion Models Wang Lin, Jingyuan Chen, Jiaxin Shi, Yichen Zhu, Chen Liang, Junzhong Miao, Tao Jin, Zhou Zhao, Fei Wu, Shuicheng Yan, Hanwang Zhang

ICLR 2024 Real3D-Portrait: One-Shot Realistic 3D Talking Portrait Synthesis Zhenhui Ye, Tianyun Zhong, Yi Ren, Jiaqi Yang, Weichuang Li, Jiawei Huang, Ziyue Jiang, Jinzheng He, Rongjie Huang, Jinglin Liu, Chen Zhang, Xiang Yin, Zejun Ma, Zhou Zhao

AAAI 2024 Structure-CLIP: Towards Scene Graph Knowledge to Enhance Multi-Modal Structured Representations Yufeng Huang, Jiji Tang, Zhuo Chen, Rongsheng Zhang, Xinfeng Zhang, Weijie Chen, Zeng Zhao, Zhou Zhao, Tangjie Lv, Zhipeng Hu, Wen Zhang

AAAI 2024 StyleSinger: Style Transfer for Out-of-Domain Singing Voice Synthesis Yu Zhang, Rongjie Huang, Ruiqi Li, Jinzheng He, Yan Xia, Feiyang Chen, Xinyu Duan, Baoxing Huai, Zhou Zhao

ICML 2024 UniAudio: Towards Universal Audio Generation with Large Language Models Dongchao Yang, Jinchuan Tian, Xu Tan, Rongjie Huang, Songxiang Liu, Haohan Guo, Xuankai Chang, Jiatong Shi, Sheng Zhao, Jiang Bian, Zhou Zhao, Xixin Wu, Helen M. Meng

CVPR 2023 ANetQA: A Large-Scale Benchmark for Fine-Grained Compositional Reasoning over Untrimmed Videos Zhou Yu, Lixiang Zheng, Zhou Zhao, Fei Wu, Jianping Fan, Kui Ren, Jun Yu

NeurIPS 2023 Achieving Cross Modal Generalization with Multimodal Unified Representation Yan Xia, Hai Huang, Jieming Zhu, Zhou Zhao

NeurIPS 2023 Connecting Multi-Modal Contrastive Representations Zehan Wang, Yang Zhao, Xize 成, Haifeng Huang, Jiageng Liu, Aoxiong Yin, Li Tang, Linjun Li, Yongqi Wang, Ziang Zhang, Zhou Zhao

NeurIPS 2023 Cross-Modal Prompts: Adapting Large Pre-Trained Models for Audio-Visual Downstream Tasks Haoyi Duan, Yan Xia, Zhou Mingze, Li Tang, Jieming Zhu, Zhou Zhao

CVPR 2023 DATE: Domain Adaptive Product Seeker for E-Commerce Haoyuan Li, Hao Jiang, Tao Jin, Mengyan Li, Yan Chen, Zhijie Lin, Yang Zhao, Zhou Zhao

ICCV 2023 Distilling Coarse-to-Fine Semantic Matching Knowledge for Weakly Supervised 3D Visual Grounding Zehan Wang, Haifeng Huang, Yang Zhao, Linjun Li, Xize Cheng, Yichen Zhu, Aoxiong Yin, Zhou Zhao

ICCV 2023 Exploring Group Video Captioning with Efficient Relational Approximation Wang Lin, Tao Jin, Ye Wang, Wenwen Pan, Linjun Li, Xize Cheng, Zhou Zhao

ICLR 2023 GeneFace: Generalized and High-Fidelity Audio-Driven 3D Talking Face Synthesis Zhenhui Ye, Ziyue Jiang, Yi Ren, Jinglin Liu, Jinzheng He, Zhou Zhao

CVPR 2023 Gloss Attention for Gloss-Free Sign Language Translation Aoxiong Yin, Tianyun Zhong, Li Tang, Weike Jin, Tao Jin, Zhou Zhao

ICML 2023 Make-an-Audio: Text-to-Audio Generation with Prompt-Enhanced Diffusion Models Rongjie Huang, Jiawei Huang, Dongchao Yang, Yi Ren, Luping Liu, Mingze Li, Zhenhui Ye, Jinglin Liu, Xiang Yin, Zhou Zhao

ICCV 2023 MixSpeech: Cross-Modality Self-Learning with Audio-Visual Stream Mixup for Visual Speech Translation and Recognition Xize Cheng, Tao Jin, Rongjie Huang, Linjun Li, Wang Lin, Zehan Wang, Ye Wang, Huadai Liu, Aoxiong Yin, Zhou Zhao

ICCV 2023 Open-Vocabulary Object Detection with an Open Corpus Jiong Wang, Huiming Zhang, Haiwen Hong, Xuan Jin, Yuan He, Hui Xue, Zhou Zhao

NeurIPS 2023 PTADisc: A Cross-Course Dataset Supporting Personalized Learning in Cold-Start Scenarios Liya Hu, Zhiang Dong, Jingyuan Chen, Guifeng Wang, Zhihua Wang, Zhou Zhao, Fei Wu

AAAI 2023 ShiftDDPMs: Exploring Conditional Diffusion Models by Shifting Diffusion Trajectories Zijian Zhang, Zhou Zhao, Jun Yu, Qi Tian

ICLR 2023 TranSpeech: Speech-to-Speech Translation with Bilateral Perturbation Rongjie Huang, Jinglin Liu, Huadai Liu, Yi Ren, Lichao Zhang, Jinzheng He, Zhou Zhao

AAAI 2023 Video-Audio Domain Generalization via Confounder Disentanglement Shengyu Zhang, Xusheng Feng, Wenyan Fan, Wenjing Fang, Fuli Feng, Wei Ji, Shuo Li, Li Wang, Shanshan Zhao, Zhou Zhao, Tat-Seng Chua, Fei Wu

CVPR 2023 WINNER: Weakly-Supervised hIerarchical decompositioN and aligNment for Spatio-tEmporal Video gRounding Mengze Li, Han Wang, Wenqiao Zhang, Jiaxu Miao, Zhou Zhao, Shengyu Zhang, Wei Ji, Fei Wu

CVPR 2022 Cross-Modal Background Suppression for Audio-Visual Event Localization Yan Xia, Zhou Zhao

NeurIPS 2022 Dict-TTS: Learning to Pronounce with Prior Dictionary Knowledge for Text-to-Speech Ziyue Jiang, Zhe Su, Zhou Zhao, Qian Yang, Yi Ren, Jinglin Liu, 振辉叶

AAAI 2022 DiffSinger: Singing Voice Synthesis via Shallow Diffusion Mechanism Jinglin Liu, Chengxi Li, Yi Ren, Feiyang Chen, Zhou Zhao

IJCAI 2022 EditSinger: Zero-Shot Text-Based Singing Voice Editing System with Diverse Prosody Modeling Lichao Zhang, Zhou Zhao, Yi Ren, Liqun Deng

IJCAI 2022 FastDiff: A Fast Conditional Diffusion Model for High-Quality Speech Synthesis Rongjie Huang, Max W. Y. Lam, Jun Wang, Dan Su, Dong Yu, Yi Ren, Zhou Zhao

CVPR 2022 Fine-Grained Predicates Learning for Scene Graph Generation Xinyu Lyu, Lianli Gao, Yuyu Guo, Zhou Zhao, Hao Huang, Heng Tao Shen, Jingkuan Song

AAAI 2022 Flow-Based Unconstrained Lip to Speech Generation Jinzheng He, Zhou Zhao, Yi Ren, Jinglin Liu, Baoxing Huai, Nicholas Jing Yuan

NeurIPS 2022 GenerSpeech: Towards Style Transfer for Generalizable Out-of-Domain Text-to-Speech Rongjie Huang, Yi Ren, Jinglin Liu, Chenye Cui, Zhou Zhao

NeurIPS 2022 M4Singer: A Multi-Style, Multi-Singer and Musical Score Provided Mandarin Singing Corpus Lichao Zhang, Ruiqi Li, Shoutong Wang, Liqun Deng, Jinglin Liu, Yi Ren, Jinzheng He, Rongjie Huang, Jieming Zhu, Xiao Chen, Zhou Zhao

CVPR 2022 MLSLT: Towards Multilingual Sign Language Translation Aoxiong Yin, Zhou Zhao, Weike Jin, Meng Zhang, Xingshan Zeng, Xiaofei He

AAAI 2022 Parallel and High-Fidelity Text-to-Lip Generation Jinglin Liu, Zhiying Zhu, Yi Ren, Wencan Huang, Baoxing Huai, Nicholas Jing Yuan, Zhou Zhao

ICLR 2022 Pseudo Numerical Methods for Diffusion Models on Manifolds Luping Liu, Yi Ren, Zhijie Lin, Zhou Zhao

IJCAI 2022 SyntaSpeech: Syntax-Aware Generative Adversarial Text-to-Speech Zhenhui Ye, Zhou Zhao, Yi Ren, Fei Wu

NeurIPS 2022 Towards Effective Multi-Modal Interchanges in Zero-Resource Sounding Object Localization Yang Zhao, Chen Zhang, Haifeng Huang, Haoyuan Li, Zhou Zhao

NeurIPS 2022 Unsupervised Representation Learning from Pre-Trained Diffusion Probabilistic Models Zijian Zhang, Zhou Zhao, Zhijie Lin

CVPR 2022 Wnet: Audio-Guided Video Object Segmentation via Wavelet-Based Cross-Modal Denoising Networks Wenwen Pan, Haonan Shi, Zhou Zhao, Jieming Zhu, Xiuqiang He, Zhigeng Pan, Lianli Gao, Jun Yu, Fei Wu, Qi Tian

CVPR 2021 Cascaded Prediction Network via Segment Tree for Temporal Video Grounding Yang Zhao, Zhou Zhao, Zhu Zhang, Zhijie Lin

ICCV 2021 Cortical Surface Shape Analysis Based on Alexandrov Polyhedra Min Zhang, Yang Guo, Na Lei, Zhou Zhao, Jianfeng Wu, Xiaoyin Xu, Yalin Wang, Xianfeng Gu

CVPRW 2021 DeVLBert: Out-of-Distribution Visio-Linguistic Pretraining with Causality Shengyu Zhang, Tan Jiang, Tan Wang, Kun Kuang, Zhou Zhao, Jianke Zhu, Jin Yu, Hongxia Yang, Fei Wu

ICLR 2021 FastSpeech 2: Fast and High-Quality End-to-End Text to Speech Yi Ren, Chenxu Hu, Xu Tan, Tao Qin, Sheng Zhao, Zhou Zhao, Tie-Yan Liu

IJCAI 2021 FedSpeech: Federated Text-to-Speech with Continual Learning Ziyue Jiang, Yi Ren, Ming Lei, Zhou Zhao

NeurIPS 2021 Generalizable Multi-Linear Attention Network Tao Jin, Zhou Zhao

CVPRW 2021 Grounded, Controllable and Debiased Image Completion with Lexical Semantics Shengyu Zhang, Tan Jiang, Qinghao Huang, Ziqi Tan, Kun Kuang, Zhou Zhao, Siliang Tang, Jin Yu, Hongxia Yang, Yi Yang, Fei Wu

ICML 2021 Learning to Rehearse in Long Sequence Memorization Zhu Zhang, Chang Zhou, Jianxin Ma, Zhijie Lin, Jingren Zhou, Hongxia Yang, Zhou Zhao

AAAI 2021 Modeling High-Order Interactions Across Multi-Interests for Micro-Video Reommendation (Student Abstract) Dong Yao, Shengyu Zhang, Zhou Zhao, Wenyan Fan, Jieming Zhu, Xiuqiang He, Fei Wu

CVPR 2021 Multi-Modal Relational Graph for Cross-Modal Video Moment Retrieval Yawen Zeng, Da Cao, Xiaochi Wei, Meng Liu, Zhou Zhao, Zheng Qin

NeurIPS 2021 PortaSpeech: Portable and High-Quality Generative Text-to-Speech Yi Ren, Jinglin Liu, Zhou Zhao

AAAI 2020 Be Relevant, Non-Redundant, and Timely: Deep Reinforcement Learning for Real-Time Event Summarization Min Yang, Chengming Li, Fei Sun, Zhou Zhao, Ying Shen, Chenglin Wu

AAAI 2020 Convolutional Hierarchical Attention Network for Query-Focused Video Summarization Shuwen Xiao, Zhou Zhao, Zijian Zhang, Xiaohui Yan, Min Yang

NeurIPS 2020 Counterfactual Contrastive Learning for Weakly-Supervised Vision-Language Grounding Zhu Zhang, Zhou Zhao, Zhijie Lin, Jieming Zhu, Xiuqiang He

AAAI 2020 Interactive Dual Generative Adversarial Networks for Image Captioning Junhao Liu, Kai Wang, Chunpu Xu, Zhou Zhao, Ruifeng Xu, Ying Shen, Min Yang

AAAI 2020 Multi-Speaker Video Dialog with Frame-Level Temporal Localization Qiang Wang, Pin Jiang, Zhiyi Guo, Yahong Han, Zhou Zhao

IJCAI 2020 Object-Aware Multi-Branch Relation Networks for Spatio-Temporal Video Grounding Zhu Zhang, Zhou Zhao, Zhijie Lin, Baoxing Huai, Jing Yuan

IJCAI 2020 Task-Level Curriculum Learning for Non-Autoregressive Neural Machine Translation Jinglin Liu, Yi Ren, Xu Tan, Chen Zhang, Tao Qin, Zhou Zhao, Tie-Yan Liu

AAAI 2020 Weakly-Supervised Video Moment Retrieval via Semantic Completion Network Zhijie Lin, Zhou Zhao, Zhu Zhang, Qi Wang, Huasheng Liu

AAAI 2019 ActivityNet-QA: A Dataset for Understanding Complex Web Videos via Question Answering Zhou Yu, Dejing Xu, Jun Yu, Ting Yu, Zhou Zhao, Yueting Zhuang, Dacheng Tao

ICML 2019 Almost Unsupervised Text to Speech and Automatic Speech Recognition Yi Ren, Xu Tan, Tao Qin, Sheng Zhao, Zhou Zhao, Tie-Yan Liu

AAAI 2019 Answer Identification from Product Reviews for User Questions by Multi-Task Attentive Networks Long Chen, Ziyu Guan, Wei Zhao, Wanqing Zhao, Xiaopeng Wang, Zhou Zhao, Huan Sun

IJCAI 2019 Beyond Product Quantization: Deep Progressive Quantization for Image Retrieval Lianli Gao, Xiaosu Zhu, Jingkuan Song, Zhou Zhao, Heng Tao Shen

AAAI 2019 Exploring Human-like Reading Strategy for Abstractive Text Summarization Min Yang, Qiang Qu, Wenting Tu, Ying Shen, Zhou Zhao, Xiaojun Chen

NeurIPS 2019 FastSpeech: Fast, Robust and Controllable Text to Speech Yi Ren, Yangjun Ruan, Xu Tan, Tao Qin, Sheng Zhao, Zhou Zhao, Tie-Yan Liu

IJCAI 2019 Localizing Unseen Activities in Video via Image Query Zhu Zhang, Zhou Zhao, Zhijie Lin, Jingkuan Song, Deng Cai

AAAI 2019 Location-Based End-to-End Speech Recognition with Multiple Language Models Zhijie Lin, Kaiyang Lin, Shiling Chen, Linlin Li, Zhou Zhao

ICLR 2019 Multilingual Neural Machine Translation with Knowledge Distillation Xu Tan, Yi Ren, Di He, Tao Qin, Zhou Zhao, Tie-Yan Liu

IJCAI 2019 Open-Ended Long-Form Video Question Answering via Hierarchical Convolutional Self-Attention Networks Zhu Zhang, Zhou Zhao, Zhijie Lin, Jingkuan Song, Xiaofei He

IJCAI 2019 Weak Supervision Enhanced Generative Network for Question Generation Yutong Wang, Jiyuan Zheng, Qijiong Liu, Zhou Zhao, Jun Xiao, Yueting Zhuang

IJCAI 2018 A Multi-Task Learning Approach for Image Captioning Wei Zhao, Benyou Wang, Jianbo Ye, Min Yang, Zhou Zhao, Ruotian Luo, Yu Qiao

IJCAI 2018 Attentional Image Retweet Modeling via Multi-Faceted Ranking Network Learning Zhou Zhao, Lingtao Meng, Jun Xiao, Min Yang, Fei Wu, Deng Cai, Xiaofei He, Yueting Zhuang

AAAI 2018 Distance-Aware DAG Embedding for Proximity Search on Heterogeneous Graphs Zemin Liu, Vincent W. Zheng, Zhou Zhao, Fanwei Zhu, Kevin Chen-Chuan Chang, Minghui Wu, Jing Ying

NeurIPS 2018 MacNet: Transferring Knowledge from Machine Comprehension to Sequence-to-Sequence Models Boyuan Pan, Yazheng Yang, Hao Li, Zhou Zhao, Yueting Zhuang, Deng Cai, Xiaofei He

AAAI 2018 Multi-Label Community-Based Question Classification via Personalized Sequence Memory Network Learning Xinyu Duan, Shengyu Zhang, Zhou Zhao, Fei Wu, Yueting Zhuang

IJCAI 2018 Multi-Turn Video Question Answering via Multi-Stream Hierarchical Attention Context Network Zhou Zhao, Xinghua Jiang, Deng Cai, Jun Xiao, Xiaofei He, Shiliang Pu

IJCAI 2018 Open-Ended Long-Form Video Question Answering via Adaptive Hierarchical Reinforced Networks Zhou Zhao, Zhu Zhang, Shuwen Xiao, Zhou Yu, Jun Yu, Deng Cai, Fei Wu, Yueting Zhuang

IJCAI 2018 Rethinking Diversified and Discriminative Proposal Generation for Visual Grounding Zhou Yu, Jun Yu, Chenchao Xiang, Zhou Zhao, Qi Tian, Dacheng Tao

AAAI 2018 StackReader: An RNN-Free Reading Comprehension Model Yibo Jiang, Zhou Zhao

AAAI 2017 Community-Based Question Answering via Asymmetric Multi-Faceted Ranking Network Learning Zhou Zhao, Hanqing Lu, Vincent W. Zheng, Deng Cai, Xiaofei He, Yueting Zhuang

IJCAI 2017 Link Prediction via Ranking Metric Dual-Level Attention Network Learning Zhou Zhao, Ben Gao, Vincent W. Zheng, Deng Cai, Xiaofei He, Yueting Zhuang

IJCAI 2017 Microblog Sentiment Classification via Recurrent Random Walk Network Learning Zhou Zhao, Hanqing Lu, Deng Cai, Xiaofei He, Yueting Zhuang

AAAI 2017 Semantic Proximity Search on Heterogeneous Graph by Proximity Embedding Zemin Liu, Vincent W. Zheng, Zhou Zhao, Fanwei Zhu, Kevin Chen-Chuan Chang, Minghui Wu, Jing Ying

IJCAI 2017 Video Question Answering via Hierarchical Spatio-Temporal Attention Networks Zhou Zhao, Qifan Yang, Deng Cai, Xiaofei He, Yueting Zhuang

AAAI 2016 Community-Based Question Answering via Heterogeneous Social Network Learning Hanyin Fang, Fei Wu, Zhou Zhao, Xinyu Duan, Yueting Zhuang, Martin Ester

IJCAI 2016 Expert Finding for Community-Based Question Answering via Ranking Metric Network Learning Zhou Zhao, Qifan Yang, Deng Cai, Xiaofei He, Yueting Zhuang

IJCAI 2015 Mobile Query Recommendation via Tensor Function Learning Zhou Zhao, Ruihua Song, Xing Xie, Xiaofei He, Yueting Zhuang