Tian, Yapeng

41 publications

NeurIPS 2025 $\texttt{AVROBUSTBENCH}$: Benchmarking the Robustness of Audio-Visual Recognition Models at Test-Time Sarthak Kumar Maharana, Saksham Singh Kushwaha, Baoming Zhang, Adrian Rodriguez, Songtao Wei, Yapeng Tian, Yunhui Guo

WACV 2025 Joint Co-Speech Gesture and Expressive Talking Face Generation Using Diffusion with Adapters Steven Hogue, Chenxu Zhang, Yapeng Tian, Xiaohu Guo

CVPR 2025 Motion-Grounded Video Reasoning: Understanding and Perceiving Motion at Pixel Level Andong Deng, Tongjia Chen, Shoubin Yu, Taojiannan Yang, Lincoln Spencer, Yapeng Tian, Ajmal Saeed Mian, Mohit Bansal, Chen Chen

ICCV 2025 PRVQL: Progressive Knowledge-Guided Refinement for Robust Egocentric Visual Query Localization Bing Fan, Yunhe Feng, Yapeng Tian, James Chenhao Liang, Yuewei Lin, Yan Huang, Heng Fan

TMLR 2025 TP-Blend: Textual-Prompt Attention Pairing for Precise Object-Style Blending in Diffusion Models Xin Jin, Yichuan Zhong, Yapeng Tian

CVPR 2025 VinTAGe: Joint Video and Text Conditioning for Holistic Audio Generation Saksham Singh Kushwaha, Yapeng Tian

ICCV 2025 ZFusion: Efficient Deep Compositional Zero-Shot Learning for Blind Image Super-Resolution with Generative Diffusion Prior Alireza Esmaeilzehi, Hossein Zaredar, Yapeng Tian, Laleh Seyyed-Kalantari

NeurIPSW 2024 AV-DiT: Efficient Audio-Visual Diffusion Transformer for Joint Audio and Video Generation Kai Wang, Shijian Deng, Jing Shi, Dimitrios Hatzinakos, Yapeng Tian

TMLR 2024 Audio-Visual Dataset Distillation Saksham Singh Kushwaha, Siva Sai Nagender Vasireddy, Kai Wang, Yapeng Tian

NeurIPS 2024 Continual Audio-Visual Sound Separation Weiguo Pian, Yiyang Nan, Shijian Deng, Shentong Mo, Yunhui Guo, Yapeng Tian

CVPRW 2024 DiffTED: One-Shot Audio-Driven TED Talk Video Generation with Diffusion-Based Co-Speech Gestures Steven Hogue, Chenxu Zhang, Hamza Daruger, Yapeng Tian, Xiaohu Guo

WACV 2024 LAVSS: Location-Guided Audio-Visual Spatial Audio Separation Yuxin Ye, Wenming Yang, Yapeng Tian

CVPRW 2024 MA-AVT: Modality Alignment for Parameter-Efficient Audio-Visual Transformers Tanvir Mahmud, Shentong Mo, Yapeng Tian, Diana Marculescu

CVPR 2024 T-VSL: Text-Guided Visual Sound Source Localization in Mixtures Tanvir Mahmud, Yapeng Tian, Diana Marculescu

CVPRW 2024 Towards Efficient Audio-Visual Learners via Empowering Pre-Trained Vision Transformers with Cross-Modal Adaptation Kai Wang, Yapeng Tian, Dimitrios Hatzinakos

NeurIPS 2023 AV-NeRF: Learning Neural Fields for Real-World Audio-Visual Scene Synthesis Susan Liang, Chao Huang, Yapeng Tian, Anurag Kumar, Chenliang Xu

ICCV 2023 Audio-Visual Class-Incremental Learning Weiguo Pian, Shentong Mo, Yunhui Guo, Yapeng Tian

CVPR 2023 Audio-Visual Grouping Network for Sound Localization from Mixtures Shentong Mo, Yapeng Tian

ICLR 2023 Basic Binary Convolution Unit for Binarized Image Restoration Network Bin Xia, Yulun Zhang, Yitong Wang, Yapeng Tian, Wenming Yang, Radu Timofte, Luc Van Gool

ICCV 2023 Class-Incremental Grouping Network for Continual Audio-Visual Learning Shentong Mo, Weiguo Pian, Yapeng Tian

ICCV 2023 DiffIR: Efficient Diffusion Model for Image Restoration Bin Xia, Yulun Zhang, Shiyin Wang, Yitong Wang, Xinglong Wu, Yapeng Tian, Wenming Yang, Luc Van Gool

NeurIPS 2023 Disentangled Counterfactual Learning for Physical Audiovisual Commonsense Reasoning Changsheng Lv, Shuai Zhang, Yapeng Tian, Mengshi Qi, Huadong Ma

CVPR 2023 Egocentric Audio-Visual Object Localization Chao Huang, Yapeng Tian, Anurag Kumar, Chenliang Xu

ICLR 2023 Knowledge Distillation Based Degradation Estimation for Blind Super-Resolution Bin Xia, Yulun Zhang, Yitong Wang, Yapeng Tian, Wenming Yang, Radu Timofte, Luc Van Gool

CVPR 2023 Structured Sparsity Learning for Efficient Video Super-Resolution Bin Xia, Jingwen He, Yulun Zhang, Yitong Wang, Yapeng Tian, Wenming Yang, Luc Van Gool

AAAI 2023 Towards Unified, Explainable, and Robust Multisensory Perception Yapeng Tian

AAAI 2022 Coarse-to-Fine Embedded PatchMatch and Multi-Scale Dynamic Aggregation for Reference-Based Super-Resolution Bin Xia, Yapeng Tian, Yucheng Hang, Wenming Yang, Qingmin Liao, Jie Zhou

AAAI 2022 Efficient Non-Local Contrastive Attention for Image Super-Resolution Bin Xia, Yucheng Hang, Yapeng Tian, Wenming Yang, Qingmin Liao, Jie Zhou

ECCV 2022 Learning Spatio-Temporal Downsampling for Effective Video Upscaling Xiaoyu Xiang, Yapeng Tian, Vijay Rengarajan, Lucas D. Young, Bo Zhu, Rakesh Ranjan

CVPR 2022 Learning to Answer Questions in Dynamic Audio-Visual Scenarios Guangyao Li, Yake Wei, Yapeng Tian, Chenliang Xu, Ji-Rong Wen, Di Hu

NeurIPS 2022 Multi-Modal Grouping Network for Weakly-Supervised Audio-Visual Video Parsing Shentong Mo, Yapeng Tian

CVPR 2022 Transformer-Empowered Multi-Scale Contextual Matching and Aggregation for Multi-Contrast MRI Super-Resolution Guangyuan Li, Jun Lv, Yapeng Tian, Qi Dou, Chengyan Wang, Chenliang Xu, Jing Qin

CVPR 2021 Can Audio-Visual Integration Strengthen Robustness Under Multimodal Attacks? Yapeng Tian, Chenliang Xu

CVPR 2021 Cyclic Co-Learning of Sounding Object Visual Grounding and Sound Separation Yapeng Tian, Di Hu, Chenliang Xu

ICCV 2021 Video Matting via Consistency-Regularized Graph Neural Networks Tiantian Wang, Sifei Liu, Yapeng Tian, Kai Li, Ming-Hsuan Yang

ECCV 2020 Unified Multisensory Perception: Weakly-Supervised Audio-Visual Video Parsing Yapeng Tian, Dingzeyu Li, Chenliang Xu

CVPRW 2019 Audio-Visual Event Localization in the Wild Yapeng Tian, Jing Shi, Bochen Li, Zhiyao Duan, Chenliang Xu

CVPRW 2019 Audio-Visual Interpretable and Controllable Video Captioning Yapeng Tian, Chenxiao Guan, Justin Goodman, Marc Moore, Chenliang Xu

CVPRW 2019 NTIRE 2019 Challenge on Video Super-Resolution: Methods and Results Seungjun Nah, Radu Timofte, Shuhang Gu, Sungyong Baik, Seokil Hong, Gyeongsik Moon, Sanghyun Son, Kyoung Mu Lee, Xintao Wang, Kelvin C. K. Chan, Ke Yu, Chao Dong, Chen Change Loy, Yuchen Fan, Jiahui Yu, Ding Liu, Thomas S. Huang, Xiao Liu, Chao Li, Dongliang He, Yukang Ding, Shilei Wen, Fatih Porikli, Ratheesh Kalarot, Muhammad Haris, Greg Shakhnarovich, Norimichi Ukita, Peng Yi, Zhongyuan Wang, Kui Jiang, Junjun Jiang, Jiayi Ma, Hang Dong, Xinyi Zhang, Zhe Hu, Kwan-Young Kim, Dong Un Kang, Se Young Chun, Kuldeep Purohit, A. N. Rajagopalan, Yapeng Tian, Yulun Zhang, Yun Fu, Chenliang Xu, Ahmet Murat Tekalp, Mustafa Akin Yilmaz, Cansu Korkmaz, Manoj Sharma, Megh Makwana, Anuj Badhwar, Ajay Pratap Singh, Avinash Upadhyay, Rudrabha Mukhopadhyay, Ankit Shukla, Dheeraj Khanna, A. S. Mandal, Santanu Chaudhury, Si Miao, Yongxin Zhu, Xiao Huo

ECCV 2018 Audio-Visual Event Localization in Unconstrained Videos Yapeng Tian, Jing Shi, Bochen Li, Zhiyao Duan, Chenliang Xu

CVPRW 2017 NTIRE 2017 Challenge on Single Image Super-Resolution: Methods and Results Radu Timofte, Eirikur Agustsson, Luc Van Gool, Ming-Hsuan Yang, Lei Zhang, Bee Lim, Sanghyun Son, Heewon Kim, Seungjun Nah, Kyoung Mu Lee, Xintao Wang, Yapeng Tian, Ke Yu, Yulun Zhang, Shixiang Wu, Chao Dong, Liang Lin, Yu Qiao, Chen Change Loy, Woong Bae, Jaejun Yoo, Yoseob Han, Jong Chul Ye, Jae-Seok Choi, Munchurl Kim, Yuchen Fan, Jiahui Yu, Wei Han, Ding Liu, Haichao Yu, Zhangyang Wang, Honghui Shi, Xinchao Wang, Thomas S. Huang, Yunjin Chen, Kai Zhang, Wangmeng Zuo, Zhimin Tang, Linkai Luo, Shaohui Li, Min Fu, Lei Cao, Wen Heng, Giang Bui, Truc Le, Ye Duan, Dacheng Tao, Ruxin Wang, Xu Lin, Jianxin Pang, Jinchang Xu, Yu Zhao, Xiangyu Xu, Jin-shan Pan, Deqing Sun, Yujin Zhang, Xibin Song, Yuchao Dai, Xueying Qin, Xuan-Phung Huynh, Tiantong Guo, Hojjat Seyed Mousavi, Tiep Huu Vu, Vishal Monga, Cristóvão Cruz, Karen O. Egiazarian, Vladimir Katkovnik, Rakesh Mehta, Arnav Kumar Jain, Abhinav Agarwalla, Ch V. Sai Praveen, Ruofan Zhou, Hongdiao Wen, Che Zhu, Zhiqiang Xia, Zhengtao Wang, Qi Guo