Xu, Dan

56 publications

ICCV 2025 Audio-Visual Controlled Video Diffusion with Masked Selective State Spaces Modeling for Natural Talking Head Generation Fa-Ting Hong, Zunnan Xu, Zixiang Zhou, Jun Zhou, Xiu Li, Qin Lin, Qinglin Lu, Dan Xu

ICCV 2025 DiGA3D: Coarse-to-Fine Diffusional Propagation of Geometry and Appearance for Versatile 3D Inpainting Jingyi Pan, Dan Xu, Qiong Luo

CVPR 2025 Flow-NeRF: Joint Learning of Geometry, Poses, and Dense Flow Within Unified Neural Representations Xunzhi Zheng, Dan Xu

CVPR 2025 Free-Viewpoint Human Animation with Pose-Correlated Reference Selection Fa-Ting Hong, Zhan Xu, Haiyang Liu, Qinjie Lin, Luchuan Song, Zhixin Shu, Yang Zhou, Duygu Ceylan, Dan Xu

ICCV 2025 From One to More: Contextual Part Latents for 3D Generation Shaocong Dong, Lihe Ding, Xiao Chen, Yaokun Li, Yuxin Wang, Yucheng Wang, Qi Wang, Jaehyeok Kim, Chenjian Gao, Zhanpeng Huang, Zibin Wang, Tianfan Xue, Dan Xu

CVPR 2025 GaussHDR: High Dynamic Range Gaussian Splatting via Learning Unified 3D and 2D Local Tone Mapping Jinfeng Liu, Lingtong Kong, Bo Li, Dan Xu

IJCAI 2025 Human-Centric Foundation Models: Perception, Generation and Agentic Modeling Shixiang Tang, Yizhou Wang, Lu Chen, Yuan Wang, Sida Peng, Dan Xu, Wanli Ouyang

NeurIPS 2025 HyRF: Hybrid Radiance Fields for Memory-Efficient and High-Quality Novel View Synthesis Zipeng Wang, Dan Xu

ICML 2025 I Think, Therefore I Diffuse: Enabling Multimodal In-Context Reasoning in Diffusion Models Zhenxing Mi, Kuan-Chieh Wang, Guocheng Qian, Hanrong Ye, Runtao Liu, Sergey Tulyakov, Kfir Aberman, Dan Xu

ICLR 2025 MMEgo: Towards Building Egocentric Multimodal LLMs for Video QA Hanrong Ye, Haotian Zhang, Erik Daxberger, Lin Chen, Zongyu Lin, Yanghao Li, Bowen Zhang, Haoxuan You, Dan Xu, Zhe Gan, Jiasen Lu, Yinfei Yang

AAAI 2025 Multi-Attribute Multi-Grained Adaptation of Pre-Trained Language Models for Text Understanding from Bayesian Perspective You Zhang, Jin Wang, Liang-Chih Yu, Dan Xu, Xuejie Zhang

ICCV 2025 Rep-MTL: Unleashing the Power of Representation-Level Task Saliency for Multi-Task Learning Zedong Wang, Siyuan Li, Dan Xu

CVPR 2025 Synergizing Motion and Appearance: Multi-Scale Compensatory Codebooks for Talking Head Video Generation Shuling Zhao, Fa-Ting Hong, Xiaoshui Huang, Dan Xu

CVPR 2025 Taming Video Diffusion Prior with Scene-Grounding Guidance for 3D Gaussian Splatting from Sparse Inputs Yingji Zhong, Zhihao Li, Dave Zhenyu Chen, Lanqing Hong, Dan Xu

ICML 2025 UniMC: Taming Diffusion Transformer for Unified Keypoint-Guided Multi-Class Image Generation Qin Guo, Ailing Zeng, Dongxu Yue, Ceyuan Yang, Yang Cao, Hanzhong Guo, Fei Shen, Wei Liu, Xihui Liu, Dan Xu

AAAI 2025 Vision-Aware Multimodal Prompt Tuning for Uploadable Multi-Source Few-Shot Domain Adaptation Kuanghong Liu, Jin Wang, Kangjian He, Dan Xu, Xuejie Zhang

CVPR 2024 CVT-xRF: Contrastive In-Voxel Transformer for 3D Consistent Radiance Fields from Sparse Inputs Yingji Zhong, Lanqing Hong, Zhenguo Li, Dan Xu

CVPR 2024 DetCLIPv3: Towards Versatile Generative Open-Vocabulary Object Detection Lewei Yao, Renjie Pi, Jianhua Han, Xiaodan Liang, Hang Xu, Wei Zhang, Zhenguo Li, Dan Xu

CVPR 2024 DiffusionMTL: Learning Multi-Task Denoising Diffusion Model from Partially Annotated Data Hanrong Ye, Dan Xu

CVPR 2024 Efficient Multitask Dense Predictor via Binarization Yuzhang Shang, Dan Xu, Gaowen Liu, Ramana Rao Kompella, Yan Yan

CVPR 2024 GS-SLAM: Dense Visual SLAM with 3D Gaussian Splatting Chi Yan, Delin Qu, Dan Xu, Bin Zhao, Zhigang Wang, Dong Wang, Xuelong Li

CVPR 2024 Implicit Event-RGBD Neural SLAM Delin Qu, Chi Yan, Dong Wang, Jie Yin, Qizhi Chen, Dan Xu, Yiting Zhang, Bin Zhao, Xuelong Li

CVPR 2024 Interactive3D: Create What You Want by Interactive 3D Generation Shaocong Dong, Lihe Ding, Zhanpeng Huang, Zibin Wang, Tianfan Xue, Dan Xu

ECCV 2024 Learning 3D Geometry and Feature Consistent Gaussian Splatting for Object Removal Yuxin Wang, Qianyi Wu, Guofeng Zhang, Dan Xu

ECCV 2024 Motion-Oriented Compositional Neural Radiance Fields for Monocular Dynamic Human Modeling Jaehyeok Kim, Dongyoon Wee, Dan Xu

AAAI 2024 Personalized LoRA for Human-Centered Text Understanding You Zhang, Jin Wang, Liang-Chih Yu, Dan Xu, Xuejie Zhang

ECCV 2024 RoomTex: Texturing Compositional Indoor Scenes via Iterative Inpainting Qi Wang, Ruijie Lu, Xudong Xu, Jingbo Wang, Michael Yu Wang, Bo Dai, Gang Zeng, Dan Xu

ECCV 2024 SegGen: Supercharging Segmentation Models with Text2Mask and Mask2Img Synthesis Hanrong Ye, Jason Kuen, Qing Liu, Zhe Lin, Brian Price, Dan Xu

CVPR 2024 Text-to-3D Generation with Bidirectional Diffusion Using Both 2D and 3D Priors Lihe Ding, Shaocong Dong, Zhanpeng Huang, Zibin Wang, Yiyuan Zhang, Kaixiong Gong, Dan Xu, Tianfan Xue

NeurIPS 2023 CoDA: Collaborative Novel Box Discovery and Cross-Modal Alignment for Open-Vocabulary 3D Object Detection Yang Cao, Zeng Yihan, Hang Xu, Dan Xu

AAAI 2023 Contrastive Multi-Task Dense Prediction Siwei Yang, Hanrong Ye, Dan Xu

CVPR 2023 DetCLIPv2: Scalable Open-Vocabulary Object Detection Pre-Training via Word-Region Alignment Lewei Yao, Jianhua Han, Xiaodan Liang, Dan Xu, Wei Zhang, Zhenguo Li, Hang Xu

ICLR 2023 Edge Guided GANs with Contrastive Learning for Semantic Image Synthesis Hao Tang, Xiaojuan Qi, Guolei Sun, Dan Xu, Nicu Sebe, Radu Timofte, Luc Van Gool

ICCV 2023 Implicit Identity Representation Conditioned Memory Compensation Network for Talking Head Video Generation Fa-Ting Hong, Dan Xu

CVPR 2023 Learning Multi-Modal Class-Specific Tokens for Weakly Supervised Dense Object Localization Lian Xu, Wanli Ouyang, Mohammed Bennamoun, Farid Boussaid, Dan Xu

ICCV 2023 Learning Unified Decompositional and Compositional NeRF for Editable Novel View Synthesis Yuxin Wang, Wayne Wu, Dan Xu

ICLR 2023 Switch-NeRF: Learning Scene Decomposition with Mixture of Experts for Large-Scale Neural Radiance Fields Zhenxing Mi, Dan Xu

ICCV 2023 TaskExpert: Dynamically Assembling Multi-Task Representations with Memorial Mixture-of-Experts Hanrong Ye, Dan Xu

ICLR 2023 TaskPrompter: Spatial-Channel Multi-Task Prompting for Dense Scene Understanding Hanrong Ye, Dan Xu

CVPR 2022 Depth-Aware Generative Adversarial Network for Talking Head Video Generation Fa-Ting Hong, Longhao Zhang, Li Shen, Dan Xu

NeurIPS 2022 DetCLIP: Dictionary-Enriched Visual-Concept Paralleled Pre-Training for Open-World Detection Lewei Yao, Jianhua Han, Youpeng Wen, Xiaodan Liang, Dan Xu, Wei Zhang, Zhenguo Li, Chunjing Xu, Hang Xu

CVPR 2022 Generalized Binary Search Network for Highly-Efficient Multi-View Stereo Zhenxing Mi, Chang Di, Dan Xu

ECCV 2022 Inverted Pyramid Multi-Task Transformer for Dense Scene Understanding Hanrong Ye, Dan Xu

ECCV 2022 Lipschitz Continuity Retained Binary Neural Network Yuzhang Shang, Dan Xu, Bin Duan, Ziliang Zong, Liqiang Nie, Yan Yan

CVPR 2022 Multi-Class Token Transformer for Weakly Supervised Semantic Segmentation Lian Xu, Wanli Ouyang, Mohammed Bennamoun, Farid Boussaid, Dan Xu

ECCV 2022 Network Binarization via Contrastive Learning Yuzhang Shang, Dan Xu, Ziliang Zong, Liqiang Nie, Yan Yan

CVPR 2021 Delving into Localization Errors for Monocular 3D Object Detection Xinzhu Ma, Yinmin Zhang, Dan Xu, Dongzhan Zhou, Shuai Yi, Haojie Li, Wanli Ouyang

CVPR 2021 Learning Parallel Dense Correspondence from Spatio-Temporal Descriptors for Efficient and Robust 4D Reconstruction Jiapeng Tang, Dan Xu, Kui Jia, Lei Zhang

ICCV 2021 Leveraging Auxiliary Tasks with Affinity Learning for Weakly Supervised Semantic Segmentation Lian Xu, Wanli Ouyang, Mohammed Bennamoun, Farid Boussaid, Ferdous Sohel, Dan Xu

ICCV 2021 SA-ConvONet: Sign-Agnostic Optimization of Convolutional Occupancy Networks Jiapeng Tang, Jiabao Lei, Dan Xu, Feiying Ma, Kui Jia, Lei Zhang

WACV 2019 Deep Micro-Dictionary Learning and Coding Network Hao Tang, Heng Wei, Wei Xiao, Wei Wang, Dan Xu, Yan Yan, Nicu Sebe

CVPR 2017 Learning Cross-Modal Deep Representations for Robust Pedestrian Detection Dan Xu, Wanli Ouyang, Elisa Ricci, Xiaogang Wang, Nicu Sebe

NeurIPS 2017 Learning Deep Structured Multi-Scale Features Using Attention-Gated CRFs for Contour Prediction Dan Xu, Wanli Ouyang, Xavier Alameda-Pineda, Elisa Ricci, Xiaogang Wang, Nicu Sebe

CVPR 2017 Multi-Scale Continuous CRFs as Sequential Deep Networks for Monocular Depth Estimation Dan Xu, Elisa Ricci, Wanli Ouyang, Xiaogang Wang, Nicu Sebe

CVPR 2017 Viraliency: Pooling Local Virality Xavier Alameda-Pineda, Andrea Pilzer, Dan Xu, Nicu Sebe, Elisa Ricci

CVPRW 2016 Background Subtraction Using Local SVD Binary Pattern Lili Guo, Dan Xu, Zhenping Qiang