Dai, Xili

14 publications

ICLR 2026 LazyDrag: Enabling Stable Drag-Based Editing on Multi-Modal Diffusion Transformers via Explicit Correspondence Zixin Yin, Xili Dai, Duomin Wang, Xianfang Zeng, Lionel Ni, Gang Yu, Heung-Yeung Shum

ICLR 2026 SpeakerVid-5m: A Large-Scale High-Quality Dataset for Audio-Visual Dyadic Interactive Human Generation Youliang Zhang, Zhaoyang Li, Duomin Wang, Jiahe Zhang, Deyu Zhou, Zixin Yin, Xili Dai, Gang Yu, Xiu Li

ICLR 2026 Training-Free Text-Guided Color Editing with Multi-Modal Diffusion Transformer Zixin Yin, Xili Dai, Ling-Hao Chen, Deyu Zhou, Jianan Wang, Duomin Wang, Gang Yu, Lionel Ni, Lei Zhang, Heung-Yeung Shum

ICLR 2025 Taming Transformer Without Using Learning Rate Warmup Xianbiao Qi, Yelin He, Jiaquan Ye, Chun-Guang Li, Bojia Zi, Xili Dai, Qin Zou, Rong Xiao

ICLR 2025 Unposed Sparse Views Room Layout Reconstruction in the Age of Pretrain Model Yaxuan Huang, Xili Dai, Jianan Wang, Xianbiao Qi, Yixing Yuan, Xiangyu Yue

NeurIPS 2024 $\textit{Bifr\"ost}$: 3D-Aware Image Compositing with Language Instructions Lingxiao Li, Kaixiong Gong, Weihong Li, Xili Dai, Tao Chen, Xiaojun Yuan, Xiangyu Yue

CPAL 2024 Closed-Loop Transcription via Convolutional Sparse Coding Xili Dai, Ke Chen, Shengbang Tong, Jingyuan Zhang, Xingjian Gao, Mingyang Li, Druv Pai, Yuexiang Zhai, Xiaojun Yuan, Heung-Yeung Shum, Lionel Ni, Yi Ma

ICLR 2024 Image Clustering via the Principle of Rate Reduction in the Age of Pretrained Models Tianzhe Chu, Shengbang Tong, Tianjiao Ding, Xili Dai, Benjamin David Haeffele, Rene Vidal, Yi Ma

CPAL 2024 Unsupervised Learning of Structured Representation via Closed-Loop Transcription Shengbang Tong, Xili Dai, Yubei Chen, Mingyang Li, Zengyi Li, Brent Yi, Yann LeCun, Yi Ma

ICLR 2023 Incremental Learning of Structured Memory via Closed-Loop Transcription Shengbang Tong, Xili Dai, Ziyang Wu, Mingyang Li, Brent Yi, Yi Ma

ICCV 2023 Unsupervised Manifold Linearizing and Clustering Tianjiao Ding, Shengbang Tong, Kwan Ho Ryan Chan, Xili Dai, Yi Ma, Benjamin D. Haeffele

WACV 2022 Learning to Reconstruct 3D Non-Cuboid Room Layout from a Single RGB Image Cheng Yang, Jia Zheng, Xili Dai, Rui Tang, Yi Ma, Xiaojun Yuan

NeurIPS 2022 Revisiting Sparse Convolutional Model for Visual Recognition Xili Dai, Mingyang Li, Pengyuan Zhai, Shengbang Tong, Xingjian Gao, Shao-Lun Huang, Zhihui Zhu, Chong You, Yi Ma

AAAI 2019 Understanding Pictograph with Facial Features: End-to-End Sentence-Level Lip Reading of Chinese Xiaobing Zhang, Haigang Gong, Xili Dai, Fan Yang, Nianbo Liu, Ming Liu