Yuan, Li

65 publications

AAAI 2025 AE-NeRF: Augmenting Event-Based Neural Radiance Fields for Non-Ideal Conditions and Larger Scenes Chaoran Feng, Wangbo Yu, Xinhua Cheng, Zhenyu Tang, Junwu Zhang, Li Yuan, Yonghong Tian

NeurIPS 2025 Beyond Chemical QA: Evaluating LLM's Chemical Reasoning with Modular Chemical Operations Li Hao, He Cao, Bin Feng, Daniel Shao, Xiangru Tang, Zhiyuan Yan, Yonghong Tian, Li Yuan, Yu Li

NeurIPS 2025 CoT-Lized Diffusion: Let's Reinforce T2I Generation Step-by-Step Zheyuan Liu, Munan Ning, Qihui Zhang, Shuo Yang, Zhongrui Wang, Yiwei Yang, Xianzhe Xu, Yibing Song, Weihua Chen, Fan Wang, Li Yuan

IJCAI 2025 Collaborative Multi-LoRA Experts with Achievement-Based Multi-Tasks Loss for Unified Multimodal Information Extraction Li Yuan, Yi Cai, Xudong Shen, Qing Li, Qingbao Huang, Zikun Deng, Tao Wang

AAAI 2025 Cycle3D: High-Quality and Consistent Image-to-3D Generation via Generation-Reconstruction Cycle Zhenyu Tang, Junwu Zhang, Xinhua Cheng, Wangbo Yu, Chaoran Feng, Yatian Pang, Bin Lin, Li Yuan

ICCV 2025 DreamDance: Animating Human Images by Enriching 3D Geometry Cues from 2D Poses Yatian Pang, Bin Zhu, Bin Lin, Mingzhe Zheng, Francis E. H. Tay, Ser-Nam Lim, Harry Yang, Li Yuan

ICCV 2025 Epona: Autoregressive Diffusion World Model for Autonomous Driving Kaiwen Zhang, Zhenyu Tang, Xiaotao Hu, Xingang Pan, Xiaoyang Guo, Yuan Liu, Jingwei Huang, Li Yuan, Qian Zhang, Xiao-Xiao Long, Xun Cao, Wei Yin

ICCV 2025 EvaGaussians: Event Stream Assisted Gaussian Splatting from Blurry Images Wangbo Yu, Chaoran Feng, Jianing Li, Jiye Tang, Jiashu Yang, Zhenyu Tang, Meng Cao, Xu Jia, Yuchao Yang, Li Yuan, Yonghong Tian

NeurIPS 2025 GS2E: Gaussian Splatting Is an Effective Data Generator for Event Stream Generation Yuchen Li, Chaoran Feng, Zhenyu Tang, Kaiyuan Deng, Wangbo Yu, Yonghong Tian, Li Yuan

CVPR 2025 Generalizing Deepfake Video Detection with Plug-and-Play: Video-Level Blending and Spatiotemporal Adapter Tuning Zhiyuan Yan, Yandan Zhao, Shen Chen, Mingyi Guo, Xinghe Fu, Taiping Yao, Shouhong Ding, Yunsheng Wu, Li Yuan

CVPR 2025 Identity-Preserving Text-to-Video Generation by Frequency Decomposition Shenghai Yuan, Jinfa Huang, Xianyi He, Yunyang Ge, Yujun Shi, Liuhan Chen, Jiebo Luo, Li Yuan

NeurIPS 2025 ImgEdit: A Unified Image Editing Dataset and Benchmark Yang Ye, Xianyi He, Zongjian Li, Bin Lin, Shenghai Yuan, Zhiyuan Yan, Bohan Hou, Li Yuan

ICCV 2025 LLaVA-CoT: Let Vision Language Models Reason Step-by-Step Guowei Xu, Peng Jin, Ziang Wu, Hao Li, Yibing Song, Lichao Sun, Li Yuan

ICCV 2025 LangBridge: Interpreting Image as a Combination of Language Embeddings Jiaqi Liao, Yuwei Niu, Fanqing Meng, Hao Li, Changyao Tian, Yinuo Du, Yuwen Xiong, Dianqi Li, Xizhou Zhu, Li Yuan, Jifeng Dai, Yu Cheng

ICLR 2025 MoE++: Accelerating Mixture-of-Experts Methods with Zero-Computation Experts Peng Jin, Bo Zhu, Li Yuan, Shuicheng Yan

ICML 2025 MoH: Multi-Head Attention as Mixture-of-Head Attention Peng Jin, Bo Zhu, Li Yuan, Shuicheng Yan

NeurIPS 2025 OpenS2V-Nexus: A Detailed Benchmark and Million-Scale Dataset for Subject-to-Video Generation Shenghai Yuan, Xianyi He, Yufan Deng, Yang Ye, Jinfa Huang, Bin Lin, Chongyang Ma, Jiebo Luo, Li Yuan

ICML 2025 Orthogonal Subspace Decomposition for Generalizable AI-Generated Image Detection Zhiyuan Yan, Jiangming Wang, Peng Jin, Ke-Yue Zhang, Chengchun Liu, Shen Chen, Taiping Yao, Shouhong Ding, Baoyuan Wu, Li Yuan

ICLR 2025 PiCO: Peer Review in LLMs Based on Consistency Optimization Kun-Peng Ning, Shuo Yang, Yuyang Liu, Jia-Yu Yao, Zhenhui Liu, Yonghong Tian, Yibing Song, Li Yuan

CVPR 2025 RoomPainter: View-Integrated Diffusion for Consistent Indoor Scene Texturing Zhipeng Huang, Wangbo Yu, Xinhua Cheng, Chengshu Zhao, Yunyang Ge, Mingyi Guo, Li Yuan, Yonghong Tian

CVPR 2025 UPME: An Unsupervised Peer Review Framework for Multimodal Large Language Model Evaluation Qihui Zhang, Munan Ning, Zheyuan Liu, Yue Huang, Shuo Yang, Yanbo Wang, Jiayi Ye, Xiao Chen, Yibing Song, Li Yuan

CVPR 2025 WF-VAE: Enhancing Video VAE by Wavelet-Driven Energy Flow for Latent Video Diffusion Model Zongjian Li, Bin Lin, Yang Ye, Liuhan Chen, Xinhua Cheng, Shenghai Yuan, Li Yuan

CVPR 2024 Chat-UniVi: Unified Visual Representation Empowers Large Language Models with Image and Video Understanding Peng Jin, Ryuichi Takanobu, Wancai Zhang, Xiaochun Cao, Li Yuan

NeurIPS 2024 ChronoMagic-Bench: A Benchmark for Metamorphic Evaluation of Text-to-Time-Lapse Video Generation Shenghai Yuan, Jinfa Huang, Yongqi Xu, Yaoyang Liu, Shaofeng Zhang, Yujun Shi, Ruijie Zhu, Xinhua Cheng, Jiebo Luo, Li Yuan

NeurIPS 2024 DF40: Toward Next-Generation Deepfake Detection Zhiyuan Yan, Taiping Yao, Shen Chen, Yandan Zhao, Xinghe Fu, Junwei Zhu, Donghao Luo, Chengjie Wang, Shouhong Ding, Yunsheng Wu, Li Yuan

ECCV 2024 FreestyleRet: Retrieving Images from Style-Diversified Queries Hao Li, Yanhao Jia, Peng Jin, Zesen Cheng, Kehan Li, Jialu Sui, Chang Liu, Li Yuan

CVPR 2024 GraCo: Granularity-Controllable Interactive Segmentation Yian Zhao, Kehan Li, Zesen Cheng, Pengchong Qiao, Xiawu Zheng, Rongrong Ji, Chang Liu, Li Yuan, Jie Chen

ECCV 2024 HiFi-123: Towards High-Fidelity One Image to 3D Content Generation Wangbo Yu, Li Yuan, Yan-Pei Cao, Xiangjun Gao, Xiaoyu Li, Wenbo Hu, Long Quan, Ying Shan, Yonghong Tian

ICLR 2024 LanguageBind: Extending Video-Language Pretraining to N-Modality by Language-Based Semantic Alignment Bin Zhu, Bin Lin, Munan Ning, Yang Yan, Jiaxi Cui, Wang HongFa, Yatian Pang, Wenhao Jiang, Junwu Zhang, Zongwei Li, Cai Wan Zhang, Zhifeng Li, Wei Liu, Li Yuan

ECCV 2024 Learning Pseudo 3D Guidance for View-Consistent Texturing with 2D Diffusion Kehan Li, Yanbo Fan, Yang Wu, Zhongqian Sun, Wei Yang, Xiangyang Ji, Li Yuan, Jie Chen

ECCV 2024 Local Action-Guided Motion Diffusion Model for Text-to-Motion Generation Peng Jin, Hao Li, Zesen Cheng, Kehan Li, Runyi Yu, Chang Liu, Xiangyang Ji, Li Yuan, Jie Chen

AAAI 2024 Parallel Vertex Diffusion for Unified Visual Grounding Zesen Cheng, Kehan Li, Peng Jin, Siheng Li, Xiangyang Ji, Li Yuan, Chang Liu, Jie Chen

ICLR 2024 Progressive3D: Progressively Local Editing for Text-to-3D Content Creation with Complex Semantic Prompts Xinhua Cheng, Tianyu Yang, Jianan Wang, Yu Li, Lei Zhang, Jian Zhang, Li Yuan

NeurIPS 2024 QKFormer: Hierarchical Spiking Transformer Using Q-K Attention Chenlin Zhou, Han Zhang, Zhaokun Zhou, Liutao Yu, Liwei Huang, Xiaopeng Fan, Li Yuan, Zhengyu Ma, Huihui Zhou, Yonghong Tian

CVPR 2024 Regressor-Segmenter Mutual Prompt Learning for Crowd Counting Mingyue Guo, Li Yuan, Zhaoyi Yan, Binghui Chen, Yaowei Wang, Qixiang Ye

ECCV 2024 Repaint123: Fast and High-Quality One Image to 3D Generation with Progressive Controllable Repainting Junwu Zhang, Zhenyu Tang, Yatian Pang, Xinhua Cheng, Peng Jin, Yida Wei, Xing Zhou, Munan Ning, Li Yuan

NeurIPS 2024 ShareGPT4Video: Improving Video Understanding and Generation with Better Captions Lin Chen, Xilin Wei, Jinsong Li, Xiaoyi Dong, Pan Zhang, Yuhang Zang, Zehui Chen, Haodong Duan, Bin Lin, Zhenyu Tang, Li Yuan, Yu Qiao, Dahua Lin, Feng Zhao, Jiaqi Wang

NeurIPS 2024 Spiking Transformer with Experts Mixture Zhaokun Zhou, Yijie Lu, Yanhao Jia, Kaiwei Che, Jun Niu, Liwei Huang, Xinyu Shi, Yuesheng Zhu, Guoqi Li, Zhaofei Yu, Li Yuan

CVPR 2024 SynSP: Synergy of Smoothness and Precision in Pose Sequences Refinement Tao Wang, Lei Jin, Zheng Wang, Jianshu Li, Liang Li, Fang Zhao, Yu Cheng, Li Yuan, Li Zhou, Junliang Xing, Jian Zhao

NeurIPSW 2024 TaxDiff: Taxonomic-Guided Diffusion Model for Protein Sequence Generation Zongying Lin, Li Hao, Liuzhenghao Lv, Yu Wang, Bin Lin, Junwu Zhang, Zijun Chen, Calvin Yu-Chian Chen, Li Yuan, Yonghong Tian

NeurIPS 2024 VLMimic: Vision Language Models Are Visual Imitation Learner for Fine-Grained Actions Guangyan Chen, Meiling Wang, Te Cui, Yao Mu, Haoyang Lu, Tianxing Zhou, Zicai Peng, Mengxiao Hu, Haizhou Li, Li Yuan, Yi Yang, Yufeng Yue

CVPR 2023 ACSeg: Adaptive Conceptualization for Unsupervised Semantic Segmentation Kehan Li, Zhennan Wang, Zesen Cheng, Runyi Yu, Yian Zhao, Guoli Song, Chang Liu, Li Yuan, Jie Chen

NeurIPS 2023 Act as You Wish: Fine-Grained Control of Motion Diffusion Model with Hierarchical Semantic Graphs Peng Jin, Yang Wu, Yanbo Fan, Zhongqian Sun, Wei Yang, Li Yuan

ICCV 2023 DiffusionRet: Generative Text-Video Retrieval with Diffusion Model Peng Jin, Hao Li, Zesen Cheng, Kehan Li, Xiangyang Ji, Chang Liu, Li Yuan, Jie Chen

NeurIPS 2023 IDRNet: Intervention-Driven Relation Network for Semantic Segmentation Zhenchao Jin, Xiaowei Hu, Lingting Zhu, Luchuan Song, Li Yuan, Lequan Yu

AAAI 2023 Joint Multimodal Entity-Relation Extraction Based on Edge-Enhanced Graph Alignment Network and Word-Pair Relation Tagging Li Yuan, Yi Cai, Jin Wang, Qing Li

CVPR 2023 Learning with Fantasy: Semantic-Aware Virtual Contrastive Constraint for Few-Shot Class-Incremental Learning Zeyin Song, Yifan Zhao, Yujun Shi, Peixi Peng, Li Yuan, Yonghong Tian

ICCV 2023 Multi-Granularity Interaction Simulation for Unsupervised Interactive Segmentation Kehan Li, Yian Zhao, Zhennan Wang, Zesen Cheng, Peng Jin, Xiangyang Ji, Li Yuan, Chang Liu, Jie Chen

CVPR 2023 Out-of-Candidate Rectification for Weakly Supervised Semantic Segmentation Zesen Cheng, Pengchong Qiao, Kehan Li, Siheng Li, Pengxu Wei, Xiangyang Ji, Li Yuan, Chang Liu, Jie Chen

NeurIPS 2023 PointGPT: Auto-Regressively Generative Pre-Training from Point Clouds Guangyan Chen, Meiling Wang, Yi Yang, Kai Yu, Li Yuan, Yufeng Yue

ICCV 2023 Rethinking Point Cloud Registration as Masking and Reconstruction Guangyan Chen, Meiling Wang, Li Yuan, Yi Yang, Yufeng Yue

NeurIPS 2023 Spike-Driven Transformer Man Yao, JiaKui Hu, Zhaokun Zhou, Li Yuan, Yonghong Tian, Bo Xu, Guoqi Li

ICLR 2023 Spikformer: When Spiking Neural Network Meets Transformer Zhaokun Zhou, Yuesheng Zhu, Chao He, Yaowei Wang, Shuicheng Yan, Yonghong Tian, Li Yuan

IJCAI 2023 Text-Video Retrieval with Disentangled Conceptualization and Set-to-Set Alignment Peng Jin, Hao Li, Zesen Cheng, Jinfa Huang, Zhennan Wang, Li Yuan, Chang Liu, Jie Chen

CVPR 2023 Video-Text as Game Players: Hierarchical Banzhaf Interaction for Cross-Modal Representation Learning Peng Jin, Jinfa Huang, Pengfei Xiong, Shangxuan Tian, Chang Liu, Xiangyang Ji, Li Yuan, Jie Chen

ICML 2022 DynaMixer: A Vision MLP Architecture with Dynamic Mixing Ziyu Wang, Wenhao Jiang, Yiming M Zhu, Li Yuan, Yibing Song, Wei Liu

ECCV 2022 Improving Vision Transformers by Revisiting High-Frequency Components Jiawang Bai, Li Yuan, Shu-Tao Xia, Shuicheng Yan, Zhifeng Li, Wei Liu

ECCV 2022 Locality Guidance for Improving Vision Transformers on Tiny Datasets Kehan Li, Runyi Yu, Zhennan Wang, Li Yuan, Guoli Song, Jie Chen

ECCV 2022 Masked Autoencoders for Point Cloud Self-Supervised Learning Yatian Pang, Wenxiao Wang, Francis E.H. Tay, Wei Liu, Yonghong Tian, Li Yuan

NeurIPS 2021 All Tokens Matter: Token Labeling for Training Better Vision Transformers Zi-Hang Jiang, Qibin Hou, Li Yuan, Daquan Zhou, Yujun Shi, Xiaojie Jin, Anran Wang, Jiashi Feng

CVPR 2021 Continual Learning via Bit-Level Information Preserving Yujun Shi, Li Yuan, Yunpeng Chen, Jiashi Feng

ICCV 2021 PnP-DETR: Towards Efficient Visual Analysis with Transformers Tao Wang, Li Yuan, Yunpeng Chen, Jiashi Feng, Shuicheng Yan

ICML 2021 Positive-Negative Momentum: Manipulating Stochastic Gradient Noise to Improve Generalization Zeke Xie, Li Yuan, Zhanxing Zhu, Masashi Sugiyama

ICCV 2021 Tokens-to-Token ViT: Training Vision Transformers from Scratch on ImageNet Li Yuan, Yunpeng Chen, Tao Wang, Weihao Yu, Yujun Shi, Zi-Hang Jiang, Francis E.H. Tay, Jiashi Feng, Shuicheng Yan

AAAI 2019 Cycle-SUM: Cycle-Consistent Adversarial LSTM Networks for Unsupervised Video Summarization Li Yuan, Francis E. H. Tay, Ping Li, Li Zhou, Jiashi Feng