Xu, Zunnan

13 publications

CVPR 2025 AToM: Aligning Text-to-Motion Model at Event-Level with GPT-4Vision Reward Haonan Han, Xiangzuo Wu, Huan Liao, Zunnan Xu, Zhongyuan Hu, Ronghui Li, Yachao Zhang, Xiu Li

ICCV 2025 Audio-Visual Controlled Video Diffusion with Masked Selective State Spaces Modeling for Natural Talking Head Generation Fa-Ting Hong, Zunnan Xu, Zixiang Zhou, Jun Zhou, Xiu Li, Qin Lin, Qinglin Lu, Dan Xu

AAAI 2025 Densely Connected Parameter-Efficient Tuning for Referring Image Segmentation Jiaqi Huang, Zunnan Xu, Ting Liu, Yong Liu, Haonan Han, Kehong Yuan, Xiu Li

CVPR 2025 FireEdit: Fine-Grained Instruction-Based Image Editing via Region-Aware Vision Language Model Jun Zhou, Jiahao Li, Zunnan Xu, Hanhui Li, Yiji Cheng, Fa-Ting Hong, Qin Lin, Qinglin Lu, Xiaodan Liang

CVPR 2025 HunyuanPortrait: Implicit Condition Control for Enhanced Portrait Animation Zunnan Xu, Zhentao Yu, Zixiang Zhou, Jun Zhou, Xiaoyu Jin, Fa-ting Hong, Xiaozhong Ji, Junwei Zhu, Chengfei Cai, Shiyu Tang, Qin Lin, Xiu Li, Qinglin Lu

ICCV 2025 REPARO: Compositional 3D Assets Generation with Differentiable 3D Layout Alignment Haonan Han, Rui Yang, Huan Liao, Jiankai Xing, Zunnan Xu, Xiaoming Yu, Junwei Zha, Xiu Li, Wanhua Li

NeurIPS 2025 SAM-R1: Leveraging SAM for Reward Feedback in Multimodal Segmentation via Reinforcement Learning Jiaqi Huang, Zunnan Xu, Jun Zhou, Ting Liu, Yicheng Xiao, Mingwen Ou, Bowen Ji, Xiu Li, Kehong Yuan

ICMLW 2024 Alignment Is All You Need: A Training-Free Augmentation Strategy for Pose-Guided Video Generation XiaoyuJin, Zunnan Xu, Mingwen Ou, Wenming Yang

IJCAI 2024 BATON: Aligning Text-to-Audio Model Using Human Preference Feedback Huan Liao, Haonan Han, Kai Yang, Tianjiao Du, Rui Yang, Qinmei Xu, Zunnan Xu, Jingquan Liu, Jiasheng Lu, Xiu Li

AAAI 2024 Chain of Generation: Multi-Modal Gesture Synthesis via Cascaded Conditional Control Zunnan Xu, Yachao Zhang, Sicheng Yang, Ronghui Li, Xiu Li

ICMLW 2024 Enhancing Fine-Grained Multi-Modal Alignment via Adapters: A Parameter-Efficient Training Framework for Referring Image Segmentation Zunnan Xu, Jiaqi Huang, Ting Liu, Yong Liu, Haonan Han, Kehong Yuan, Xiu Li

NeurIPS 2024 MambaTalk: Efficient Holistic Gesture Synthesis with Selective State Space Models Zunnan Xu, Yukang Lin, Haonan Han, Sicheng Yang, Ronghui Li, Yachao Zhang, Xiu Li

ICCV 2023 Bridging Vision and Language Encoders: Parameter-Efficient Tuning for Referring Image Segmentation Zunnan Xu, Zhihong Chen, Yong Zhang, Yibing Song, Xiang Wan, Guanbin Li