Xu, Chenliang

59 publications

ICML 2025 BinauralFlow: A Causal and Streamable Approach for High-Quality Binaural Speech Synthesis with Flow Matching Models Susan Liang, Dejan Markovic, Israel D. Gebru, Steven Krenn, Todd Keebler, Jacob Sandakly, Frank Yu, Samuel Hassel, Chenliang Xu, Alexander Richard

AAAI 2025 CaRDiff: Video Salient Object Ranking Chain of Thought Reasoning for Saliency Prediction with Diffusion Yunlong Tang, Gen Zhan, Li Yang, Yiting Liao, Chenliang Xu

AAAI 2025 Empowering LLMs with Pseudo-Untrimmed Videos for Audio-Visual Temporal Understanding Yunlong Tang, Daiki Shimada, Jing Bi, Mingqian Feng, Hang Hua, Chenliang Xu

ICCV 2025 GestureLSM: Latent Shortcut Based Co-Speech Gesture Generation with Spatial-Temporal Modeling Pinxin Liu, Luchuan Song, Junhua Huang, Haiyang Liu, Chenliang Xu

NeurIPS 2025 Harnessing the Computation Redundancy in ViTs to Boost Adversarial Transferability Jiani Liu, Zhiyuan Wang, Zeliang Zhang, Chao Huang, Susan Liang, Yunlong Tang, Chenliang Xu

CVPR 2025 Learning to Highlight Audio by Watching Movies Chao Huang, Ruohan Gao, J. M. F. Tsang, Jan Kurcius, Cagdas Bilen, Chenliang Xu, Anurag Kumar, Sanjeel Parekh

NeurIPS 2025 MMPerspective: Do MLLMs Understand Perspective? a Comprehensive Benchmark for Perspective Perception, Reasoning, and Robustness Yunlong Tang, Pinxin Liu, Zhangyun Tan, Mingqian Feng, Rui Mao, Chao Huang, Jing Bi, Yunzhong Xiao, Susan Liang, Hang Hua, Ali Vosoughi, Luchuan Song, Zeliang Zhang, Chenliang Xu

ICCV 2025 P-AVAS: Can Physics-Integrated Audio-Visual Modeling Boost Neural Acoustic Synthesis? Susan Liang, Chao Huang, Yunlong Tang, Zeliang Zhang, Chenliang Xu

ICLR 2025 Rethinking Audio-Visual Adversarial Vulnerability from Temporal and Modality Perspectives Zeliang Zhang, Susan Liang, Daiki Shimada, Chenliang Xu

CVPR 2025 Targeted Forgetting of Image Subgroups in CLIP Models Zeliang Zhang, Gaowen Liu, Charles Fleming, Ramana Rao Kompella, Chenliang Xu

CVPR 2025 Unveiling Visual Perception in Language Models: An Attention Head Analysis Approach Jing Bi, Junjia Guo, Yunlong Tang, Lianggong Bruce Wen, Zhang Liu, Bingjie Wang, Chenliang Xu

AAAI 2025 V2Xum-LLM: Cross-Modal Video Summarization with Temporal Prompt Instruction Tuning Hang Hua, Yunlong Tang, Chenliang Xu, Jiebo Luo

CVPR 2025 VidComposition: Can MLLMs Analyze Compositions in Compiled Videos? Yunlong Tang, Junjia Guo, Hang Hua, Susan Liang, Mingqian Feng, Xinyang Li, Rui Mao, Chao Huang, Jing Bi, Zeliang Zhang, Pooyan Fazli, Chenliang Xu

NeurIPS 2025 ZeroSep: Separate Anything in Audio with Zero Training Chao Huang, Yuesheng Ma, Junxuan Huang, Susan Liang, Yunlong Tang, Jing Bi, Wenqiang Liu, Nima Mesgarani, Chenliang Xu

CVPR 2024 Discover and Mitigate Multiple Biased Subgroups in Image Classifiers Zeliang Zhang, Mingqian Feng, Zhiheng Li, Chenliang Xu

CVPR 2024 Learning to Transform Dynamically for Better Adversarial Transferability Rongyi Zhu, Zeliang Zhang, Susan Liang, Zhuo Liu, Chenliang Xu

ECCV 2024 Modeling and Driving Human Body Soundfields Through Acoustic Primitives Chao Huang, Dejan Markovic, Chenliang Xu, Alexander Richard

ICLR 2024 One Forward Is Enough for Neural Network Training via Likelihood Ratio Method Jinyang Jiang, Zeliang Zhang, Chenliang Xu, Zhaofei Yu, Yijie Peng

ECCV 2024 Tri^2-Plane: Thinking Head Avatar via Feature Pyramid Luchuan Song, Pinxin Liu, Lele Chen, Guojun Yin, Chenliang Xu

CVPR 2023 A Whac-a-Mole Dilemma: Shortcuts Come in Multiples Where Mitigating One Amplifies Others Zhiheng Li, Ivan Evtimov, Albert Gordo, Caner Hazirbas, Tal Hassner, Cristian Canton Ferrer, Chenliang Xu, Mark Ibrahim

NeurIPS 2023 AV-NeRF: Learning Neural Fields for Real-World Audio-Visual Scene Synthesis Susan Liang, Chao Huang, Yapeng Tian, Anurag Kumar, Chenliang Xu

CVPR 2023 Egocentric Audio-Visual Object Localization Chao Huang, Yapeng Tian, Anurag Kumar, Chenliang Xu

ICCV 2023 Emotional Listener Portrait: Neural Listener Head Generation with Emotion Luchuan Song, Guojun Yin, Zhenchao Jin, Xiaoyi Dong, Chenliang Xu

ECCV 2022 Discover and Mitigate Unknown Biases with Debiasing Alternate Networks Zhiheng Li, Anthony Hoogs, Chenliang Xu

CVPR 2022 Learning to Answer Questions in Dynamic Audio-Visual Scenarios Guangyao Li, Yake Wei, Yapeng Tian, Chenliang Xu, Ji-Rong Wen, Di Hu

CVPR 2022 SpaceEdit: Learning a Unified Editing Space for Open-Domain Image Color Editing Jing Shi, Ning Xu, Haitian Zheng, Alex Smith, Jiebo Luo, Chenliang Xu

CVPR 2022 StyleT2I: Toward Compositional and High-Fidelity Text-to-Image Synthesis Zhiheng Li, Martin Renqiang Min, Kai Li, Chenliang Xu

CVPR 2022 Transformer-Empowered Multi-Scale Contextual Matching and Aggregation for Multi-Contrast MRI Super-Resolution Guangyuan Li, Jun Lv, Yapeng Tian, Qi Dou, Chengyan Wang, Chenliang Xu, Jing Qin

ICCV 2021 A Simple Baseline for Weakly-Supervised Scene Graph Generation Jing Shi, Yiwu Zhong, Ning Xu, Yin Li, Chenliang Xu

CVPR 2021 Can Audio-Visual Integration Strengthen Robustness Under Multimodal Attacks? Yapeng Tian, Chenliang Xu

CVPR 2021 Cyclic Co-Learning of Sounding Object Visual Grounding and Sound Separation Yapeng Tian, Di Hu, Chenliang Xu

ICCV 2021 Discover the Unknown Biased Attribute of an Image Classifier Zhiheng Li, Chenliang Xu

ICCV 2021 Explaining Local, Global, and Higher-Order Interactions in Deep Learning Samuel Lerman, Charles Venuto, Henry Kautz, Chenliang Xu

CVPR 2021 High-Fidelity Face Tracking for AR/VR via Deep Lighting Adaptation Lele Chen, Chen Cao, Fernando De la Torre, Jason Saragih, Chenliang Xu, Yaser Sheikh

WACV 2021 How to Make a BLT Sandwich? Learning VQA Towards Understanding Web Instructional Videos Shaojie Wang, Wentian Zhao, Ziyi Kou, Jing Shi, Chenliang Xu

WACV 2021 Improve CAM with Auto-Adapted Segmentation and Co-Supervised Augmentation Ziyi Kou, Guofeng Cui, Shaojie Wang, Wentian Zhao, Chenliang Xu

CVPR 2021 Learning by Planning: Language-Guided Global Image Editing Jing Shi, Ning Xu, Yihang Xu, Trung Bui, Franck Dernoncourt, Chenliang Xu

ICCV 2021 Learning to Generate Scene Graph from Natural Language Supervision Yiwu Zhong, Jing Shi, Jianwei Yang, Chenliang Xu, Yin Li

ICCV 2021 Procedure Planning in Instructional Videos via Contextual Modeling and Model-Based Policy Learning Jing Bi, Jiebo Luo, Chenliang Xu

AAAI 2020 Learning from Interventions Using Hierarchical Policies for Safe Learning Jing Bi, Vikas Dhiman, Tianyou Xiao, Chenliang Xu

WACV 2020 TailorGAN: Making User-Defined Fashion Designs Lele Chen, Justin Tian, Guo Li, Cheng-Haw Wu, Erh-Kan King, Kuan-Ting Chen, Shao-Hang Hsieh, Chenliang Xu

ECCV 2020 Talking-Head Generation with Rhythmic Head Motion Lele Chen, Guofeng Cui, Celong Liu, Zhong Li, Ziyi Kou, Yi Xu, Chenliang Xu

ECCV 2020 Unified Multisensory Perception: Weakly-Supervised Audio-Visual Video Parsing Yapeng Tian, Dingzeyu Li, Chenliang Xu

CVPRW 2019 Audio-Visual Event Localization in the Wild Yapeng Tian, Jing Shi, Bochen Li, Zhiyao Duan, Chenliang Xu

CVPRW 2019 Audio-Visual Interpretable and Controllable Video Captioning Yapeng Tian, Chenxiao Guan, Justin Goodman, Marc Moore, Chenliang Xu

IJCAI 2019 GAN-EM: GAN Based EM Learning Framework Wentian Zhao, Shaojie Wang, Zhihuai Xie, Jing Shi, Chenliang Xu

CVPRW 2019 NTIRE 2019 Challenge on Video Super-Resolution: Methods and Results Seungjun Nah, Radu Timofte, Shuhang Gu, Sungyong Baik, Seokil Hong, Gyeongsik Moon, Sanghyun Son, Kyoung Mu Lee, Xintao Wang, Kelvin C. K. Chan, Ke Yu, Chao Dong, Chen Change Loy, Yuchen Fan, Jiahui Yu, Ding Liu, Thomas S. Huang, Xiao Liu, Chao Li, Dongliang He, Yukang Ding, Shilei Wen, Fatih Porikli, Ratheesh Kalarot, Muhammad Haris, Greg Shakhnarovich, Norimichi Ukita, Peng Yi, Zhongyuan Wang, Kui Jiang, Junjun Jiang, Jiayi Ma, Hang Dong, Xinyi Zhang, Zhe Hu, Kwan-Young Kim, Dong Un Kang, Se Young Chun, Kuldeep Purohit, A. N. Rajagopalan, Yapeng Tian, Yulun Zhang, Yun Fu, Chenliang Xu, Ahmet Murat Tekalp, Mustafa Akin Yilmaz, Cansu Korkmaz, Manoj Sharma, Megh Makwana, Anuj Badhwar, Ajay Pratap Singh, Avinash Upadhyay, Rudrabha Mukhopadhyay, Ankit Shukla, Dheeraj Khanna, A. S. Mandal, Santanu Chaudhury, Si Miao, Yongxin Zhu, Xiao Huo

CVPRW 2019 Sound to Visual: Hierarchical Cross-Modal Talking Face Generation Lele Chen, Haitian Zheng, Ross K. Maddox, Zhiyao Duan, Chenliang Xu

ECCV 2018 Audio-Visual Event Localization in Unconstrained Videos Yapeng Tian, Jing Shi, Bochen Li, Zhiyao Duan, Chenliang Xu

WACV 2018 Improving Text-Based Person Search by Spatial Matching and Adaptive Threshold Tianlang Chen, Chenliang Xu, Jiebo Luo

ECCV 2018 Lip Movements Generation at a Glance Lele Chen, Zhiheng Li, Ross K Maddox, Zhiyao Duan, Chenliang Xu

AAAI 2018 Towards Automatic Learning of Procedures from Web Instructional Videos Luowei Zhou, Chenliang Xu, Jason J. Corso

CVPR 2017 Weakly Supervised Actor-Action Segmentation via Robust Multi-Task Ranking Yan Yan, Chenliang Xu, Dawen Cai, Jason J. Corso

CVPR 2016 Actor-Action Semantic Segmentation with Grouping Process Models Chenliang Xu, Jason J. Corso

CVPR 2015 Can Humans Fly? Action Understanding with Multiple Classes of Actors Chenliang Xu, Shao-Hang Hsieh, Caiming Xiong, Jason J. Corso

CVPR 2013 A Thousand Frames in Just a Few Words: Lingual Description of Videos Through Latent Topics and Sparse Object Stitching Pradipto Das, Chenliang Xu, Richard F. Doell, Jason J. Corso

ICCV 2013 Flattening Supervoxel Hierarchies by the Uniform Entropy Slice Chenliang Xu, Spencer Whitt, Jason J. Corso

CVPR 2012 Evaluation of Super-Voxel Methods for Early Video Processing Chenliang Xu, Jason J. Corso

ECCV 2012 Streaming Hierarchical Video Segmentation Chenliang Xu, Caiming Xiong, Jason J. Corso