Lu, Yan

80 publications

ICCV 2025 Bitrate-Controlled Diffusion for Disentangling Motion and Content in Video Xiao Li, Qi Chen, Xiulian Peng, Kai Yu, Xie Chen, Yan Lu

ICCV 2025 DLF: Extreme Image Compression with Dual-Generative Latent Fusion Naifu Xue, Zhaoyang Jia, Jiahao Li, Bin Li, Yuan Zhang, Yan Lu

NeurIPS 2025 Deep Video Discovery: Agentic Search with Tool Use for Long-Form Video Understanding Xiaoyi Zhang, Zhaoyang Jia, Zongyu Guo, Jiahao Li, Bin Li, Houqiang Li, Yan Lu

NeurIPS 2025 FuncGenFoil: Airfoil Generation and Editing Model in Function Space Jinouwen Zhang, Junjie Ren, Qianhong Ma, Jianyu Wu, Aobo Yang, Yan Lu, Lu Chen, Hairun Xie, Jing Wang, Miao Zhang, Wanli Ouyang, Shixiang Tang

CVPR 2025 I2VGuard: Safeguarding Images Against Misuse in Diffusion-Based Image-to-Video Models Dongnan Gui, Xun Guo, Wengang Zhou, Yan Lu

NeurIPS 2025 Image as a World: Generating Interactive World from Single Image via Panoramic Video Generation Dongnan Gui, Xun Guo, Wengang Zhou, Yan Lu

AAAI 2025 MEATRD: Multimodal Anomalous Tissue Region Detection Enhanced with Spatial Transcriptomics Kaichen Xu, Qilong Wu, Yan Lu, Yinan Zheng, Wenlin Li, Xingjie Tang, Jun Wang, Xiaobo Sun

NeurIPS 2025 Omnidirectional 3D Scene Reconstruction from Single Image Ren Yang, Jiahao Li, Yan Lu

NeurIPS 2025 One-Step Diffusion-Based Image Compression with Semantic Distillation Naifu Xue, Zhaoyang Jia, Jiahao Li, Bin Li, Yuan Zhang, Yan Lu

CVPR 2025 PICD: Versatile Perceptual Image Compression with Diffusion Rendering Tongda Xu, Jiahao Li, Bin Li, Yan Wang, Ya-Qin Zhang, Yan Lu

NeurIPS 2025 PRING: Rethinking Protein-Protein Interaction Prediction from Pairs to Graphs Xinzhe Zheng, Hao Du, Fanding Xu, Jinzhe Li, Zhiyuan Liu, WenkangWang, Tao Chen, Wanli Ouyang, Stan Z. Li, Yan Lu, Nanqing Dong, Yang Zhang

NeurIPS 2025 STAR: A Benchmark for Astronomical Star Fields Super-Resolution Kuocheng Wu, Guohang Zhuang, Jinyang Huang, Xiang Zhang, Wanli Ouyang, Yan Lu

CVPR 2025 SVLTA: Benchmarking Vision-Language Temporal Alignment via Synthetic Video Situation Hao Du, Bo Wu, Yan Lu, Zhendong Mao

NeurIPS 2025 Scientists' First Exam: Probing Cognitive Abilities of MLLM via Perception, Understanding, and Reasoning Yuhao Zhou, Yiheng Wang, Xuming He, Ruoyao Xiao, Zhiwei Li, Qiantai Feng, Zijie Guo, Yuejin Yang, Hao Wu, Wenxuan Huang, Jiaqi Wei, Dan Si, Yao Xiuqi, Jia Bu, Haiwen Huang, Tianfan Fu, Shixiang Tang, Ben Fei, Dongzhan Zhou, Fenghua Ling, Yan Lu, Siqi Sun, Chenhui Li, Guanjie Zheng, Jiancheng Lv, Wenlong Zhang, Lei Bai

ICCV 2025 StreamGS: Online Generalizable Gaussian Splatting Reconstruction for Unposed Image Streams Yang Li, Jinglu Wang, Lei Chu, Xiao Li, Shiu-Hong Kao, Ying-Cong Chen, Yan Lu

IJCAI 2025 Towards Anytime Retrieval: A Benchmark for Anytime Person Re-Identification Xulin Li, Yan Lu, Bin Liu, Jiaze Li, Qinhong Yang, Tao Gong, Qi Chu, Mang Ye, Nenghai Yu

CVPR 2025 Towards Practical Real-Time Neural Video Compression Zhaoyang Jia, Bin Li, Jiahao Li, Wenxuan Xie, Linfeng Qi, Houqiang Li, Yan Lu

CVPR 2025 UniGraspTransformer: Simplified Policy Distillation for Scalable Dexterous Robotic Grasping Wenbo Wang, Fangyun Wei, Lei Zhou, Xi Chen, Lin Luo, Xiaohan Yi, Yizhong Zhang, Yaobo Liang, Chang Xu, Yan Lu, Jiaolong Yang, Baining Guo

NeurIPS 2025 VideoVLA: Video Generators Can Be Generalizable Robot Manipulators Yichao Shen, Fangyun Wei, Zhiying Du, Yaobo Liang, Yan Lu, Jiaolong Yang, Nanning Zheng, Baining Guo

AAAI 2024 Arbitrary-Scale Video Super-Resolution Guided by Dynamic Context Cong Huang, Jiahao Li, Lei Chu, Dong Liu, Yan Lu

ICML 2024 Breaking Through the Learning Plateaus of In-Context Learning in Transformer Jingwen Fu, Tao Yang, Yuwang Wang, Yan Lu, Nanning Zheng

NeurIPS 2024 Diffusion Model with Cross Attention as an Inductive Bias for Disentanglement Tao Yang, Cuiling Lan, Yan Lu, Nanning Zheng

CVPR 2024 Generative Latent Coding for Ultra-Low Bitrate Image Compression Zhaoyang Jia, Jiahao Li, Bin Li, Houqiang Li, Yan Lu

CVPR 2024 Hierarchical Intra-Modal Correlation Learning for Label-Free 3D Semantic Segmentation Xin Kang, Lei Chu, Jiahao Li, Xuejin Chen, Yan Lu

CVPR 2024 Implicit Motion Function Yue Gao, Jiahao Li, Lei Chu, Yan Lu

ECCV 2024 Long-Term Temporal Context Gathering for Neural Video Compression Linfeng Qi, Zhaoyang Jia, Jiahao Li, Bin Li, Houqiang Li, Yan Lu

ICLR 2024 Mask-Based Modeling for Neural Radiance Fields Ganlin Yang, Guoqiang Wei, Zhizheng Zhang, Yan Lu, Dong Liu

AAAI 2024 MotionGPT: Finetuned LLMs Are General-Purpose Motion Generators Yaqi Zhang, Di Huang, Bin Liu, Shixiang Tang, Yan Lu, Lu Chen, Lei Bai, Qi Chu, Nenghai Yu, Wanli Ouyang

CVPR 2024 MovieChat: From Dense Token to Sparse Memory for Long Video Understanding Enxin Song, Wenhao Chai, Guanhong Wang, Yucheng Zhang, Haoyang Zhou, Feiyang Wu, Haozhe Chi, Xun Guo, Tian Ye, Yanting Zhang, Yan Lu, Jenq-Neng Hwang, Gaoang Wang

CVPR 2024 Neural Video Compression with Feature Modulation Jiahao Li, Bin Li, Yan Lu

CVPR 2024 QDFormer: Towards Robust Audiovisual Segmentation in Complex Environments with Quantization-Based Semantic Decomposition Xiang Li, Jinglu Wang, Xiaohao Xu, Xiulian Peng, Rita Singh, Yan Lu, Bhiksha Raj

NeurIPS 2024 Slot-VLM: Object-Event Slots for Video-Language Modeling Jiaqi Xu, Cuiling Lan, Wenxuan Xie, Xuejin Chen, Yan Lu

CVPR 2024 Text Grouping Adapter: Adapting Pre-Trained Text Detector for Layout Analysis Tianci Bi, Xiaoyi Zhang, Zhizheng Zhang, Wenxuan Xie, Cuiling Lan, Yan Lu, Nanning Zheng

AAAI 2024 Unifying Multi-Modal Uncertainty Modeling and Semantic Alignment for Text-to-Image Person Re-Identification Zhiwei Zhao, Bin Liu, Yan Lu, Qi Chu, Nenghai Yu

AAAI 2023 Active Token Mixer Guoqiang Wei, Zhizheng Zhang, Cuiling Lan, Yan Lu, Zhibo Chen

ICCV 2023 Adaptive Frequency Filters as Efficient Global Token Mixers Zhipeng Huang, Zhizheng Zhang, Cuiling Lan, Zheng-Jun Zha, Yan Lu, Baining Guo

CVPR 2023 Crossing the Gap: Domain Generalization for Image Captioning Yuchen Ren, Zhendong Mao, Shancheng Fang, Yan Lu, Tong He, Hao Du, Yongdong Zhang, Wanli Ouyang

CVPR 2023 Deep Frequency Filtering for Domain Generalization Shiqi Lin, Zhizheng Zhang, Zhipeng Huang, Yan Lu, Cuiling Lan, Peng Chu, Quanzeng You, Jiang Wang, Zicheng Liu, Amey Parulkar, Viraj Navkal, Zhibo Chen

NeurIPS 2023 DisDiff: Unsupervised Disentanglement of Diffusion Probabilistic Models Tao Yang, Yuwang Wang, Yan Lu, Nanning Zheng

ICLR 2023 EVC: Towards Real-Time Neural Image Compression with Mask Decay Wang Guo-Hua, Jiahao Li, Bin Li, Yan Lu

ICCV 2023 Efficient View Synthesis with Neural Radiance Distribution Field Yushuang Wu, Xiao Li, Jinglu Wang, Xiaoguang Han, Shuguang Cui, Yan Lu

CVPR 2023 High-Fidelity and Freely Controllable Talking Head Video Generation Yue Gao, Yuan Zhou, Jinglu Wang, Xiao Li, Xiang Ming, Yan Lu

NeurIPS 2023 Learning Trajectories Are Generalization Indicators Jingwen Fu, Zhizheng Zhang, Dacheng Yin, Yan Lu, Nanning Zheng

CVPR 2023 Motion Information Propagation for Neural Video Compression Linfeng Qi, Jiahao Li, Bin Li, Houqiang Li, Yan Lu

AAAI 2023 Multi-View Domain Adaptive Object Detection on Camera Networks Yan Lu, Zhun Zhong, Yuanchao Shu

CVPR 2023 Neural Video Compression with Diverse Contexts Jiahao Li, Bin Li, Yan Lu

ICCV 2023 Robust Referring Video Object Segmentation with Cyclic Structural Consensus Xiang Li, Jinglu Wang, Xiaohao Xu, Xiao Li, Bhiksha Raj, Yan Lu

ICCV 2023 StableVideo: Text-Driven Consistency-Aware Diffusion Video Editing Wenhao Chai, Xun Guo, Gaoang Wang, Yan Lu

CVPR 2023 Structural Multiplane Image: Bridging Neural View Synthesis and 3D Reconstruction Mingfang Zhang, Jinglu Wang, Xiao Li, Yifei Huang, Yoichi Sato, Yan Lu

CVPR 2023 Two-Shot Video Object Segmentation Kun Yan, Xiao Li, Fangyun Wei, Jinglu Wang, Chenbin Zhang, Ping Wang, Yan Lu

CVPR 2023 Unifying Layout Generation with a Decoupled Diffusion Model Mude Hui, Zhizheng Zhang, Xiaoyi Zhang, Wenxuan Xie, Yuwang Wang, Yan Lu

ICLR 2023 Versatile Neural Processes for Learning Implicit Neural Representations Zongyu Guo, Cuiling Lan, Zhizheng Zhang, Yan Lu, Zhibo Chen

CVPR 2023 VideoTrack: Learning to Track Objects via Video Transformer Fei Xie, Lei Chu, Jiahao Li, Yan Lu, Chao Ma

NeurIPS 2022 Alignment-Guided Temporal Attention for Video Action Recognition Yizhou Zhao, Zhenyang Li, Xun Guo, Yan Lu

ECCV 2022 Counterfactual Intervention Feature Transfer for Visible-Infrared Person Re-Identification Xulin Li, Yan Lu, Bin Liu, Yating Liu, Guojun Yin, Qi Chu, Jinyang Huang, Feng Zhu, Rui Zhao, Nenghai Yu

AAAI 2022 Hybrid Instance-Aware Temporal Fusion for Online Video Instance Segmentation Xiang Li, Jinglu Wang, Xiao Li, Yan Lu

NeurIPS 2022 Mask-Based Latent Reconstruction for Reinforcement Learning Tao Yu, Zhizheng Zhang, Cuiling Lan, Yan Lu, Zhibo Chen

ECCV 2022 Neural Capture of Animatable 3D Human from Monocular Video Gusi Te, Xiu Li, Xiao Li, Jinglu Wang, Wei Hu, Yan Lu

CVPR 2022 Neural Compression-Based Feature Learning for Video Restoration Cong Huang, Jiahao Li, Bin Li, Dong Liu, Yan Lu

AAAI 2022 Reliable Propagation-Correction Modulation for Video Object Segmentation Xiaohao Xu, Jinglu Wang, Xiao Li, Yan Lu

CVPR 2022 Rethinking Minimal Sufficient Representation in Contrastive Learning Haoqing Wang, Xun Guo, Zhi-Hong Deng, Yan Lu

CVPR 2022 Self-Supervised Image Representation Learning with Geometric Set Consistency Nenglun Chen, Lei Chu, Hao Pan, Yan Lu, Wenping Wang

CVPR 2022 Semantic-Aligned Fusion Transformer for One-Shot Object Detection Yizhou Zhao, Xun Guo, Yan Lu

NeurIPS 2022 Visual Concepts Tokenization Tao Yang, Yuwang Wang, Yan Lu, Nanning Zheng

CVPRW 2021 A Universal Encoder Rate Distortion Optimization Framework for Learned Compression Jing Zhao, Bin Li, Jiahao Li, Ruiqin Xiong, Yan Lu

NeurIPS 2021 Deep Contextual Video Compression Jiahao Li, Bin Li, Yan Lu

ICCV 2021 Geometry Uncertainty Projection Network for Monocular 3D Object Detection Yan Lu, Xinzhu Ma, Lei Yang, Tianzhu Zhang, Yating Liu, Qi Chu, Junjie Yan, Wanli Ouyang

AAAI 2021 Interactive Speech and Noise Modeling for Speech Enhancement Chengyu Zheng, Xiulian Peng, Yuan Zhang, Sriram Srinivasan, Yan Lu

AAAI 2021 Joint Color-Irrelevant Consistency Learning and Identity-Aware Modality Adaptation for Visible-Infrared Cross Modality Person Re-Identification Zhiwei Zhao, Bin Liu, Qi Chu, Yan Lu, Nenghai Yu

CVPR 2021 SSAN: Separable Self-Attention Network for Video Representation Learning Xudong Guo, Xun Guo, Yan Lu

ICCV 2021 Self-Supervised Video Representation Learning with Meta-Contrastive Network Yuanze Lin, Xun Guo, Yan Lu

ICCV 2021 T-Net: Effective Permutation-Equivariant Network for Two-View Correspondence Learning Zhen Zhong, Guobao Xiao, Linxin Zheng, Yan Lu, Jiayi Ma

AAAI 2021 Weakly-Supervised Temporal Action Localization by Uncertainty Modeling Pilhyeon Lee, Jinglu Wang, Yan Lu, Hyeran Byun

CVPRW 2019 In Defense of the Classification Loss for Person Re-Identification Yao Zhai, Xun Guo, Yan Lu, Houqiang Li

AAAI 2019 MVPNet: Multi-View Point Regression Networks for 3D Object Reconstruction from a Single Image Jinglu Wang, Bo Sun, Yan Lu

AAAI 2019 MonoGRNet: A Geometric Reasoning Network for Monocular 3D Object Localization Zengyi Qin, Jinglu Wang, Yan Lu

ECCV 2018 Affinity Derivation and Graph Merge for Instance Segmentation Yiding Liu, Siyu Yang, Bin Li, Wengang Zhou, Jizheng Xu, Houqiang Li, Yan Lu

ECCVW 2018 Channel Pruning for Visual Tracking Manqiang Che, Runling Wang, Yan Lu, Yan Li, Hui Zhi, Changzhen Xiong

ECCVW 2018 The Sixth Visual Object Tracking VOT2018 Challenge Results Matej Kristan, Ales Leonardis, Jiri Matas, Michael Felsberg, Roman P. Pflugfelder, Luka Cehovin Zajc, Tomás Vojír, Goutam Bhat, Alan Lukezic, Abdelrahman Eldesokey, Gustavo Fernández, Álvaro García-Martín, Álvaro Iglesias-Arias, A. Aydin Alatan, Abel González-García, Alfredo Petrosino, Alireza Memarmoghadam, Andrea Vedaldi, Andrej Muhic, Anfeng He, Arnold W. M. Smeulders, Asanka G. Perera, Bo Li, Boyu Chen, Changick Kim, Changsheng Xu, Changzhen Xiong, Cheng Tian, Chong Luo, Chong Sun, Cong Hao, Daijin Kim, Deepak Mishra, Deming Chen, Dong Wang, Dongyoon Wee, Efstratios Gavves, Erhan Gundogdu, Erik Velasco-Salido, Fahad Shahbaz Khan, Fan Yang, Fei Zhao, Feng Li, Francesco Battistone, George De Ath, Gorthi R. K. Sai Subrahmanyam, Guilherme Sousa Bastos, Haibin Ling, Hamed Kiani Galoogahi, Hankyeol Lee, Haojie Li, Haojie Zhao, Heng Fan, Honggang Zhang, Horst Possegger, Houqiang Li, Huchuan Lu, Hui Zhi, Huiyun Li, Hyemin Lee, Hyung Jin Chang, Isabela Drummond, Jack Valmadre, Jaime Spencer Martin, Javaan Singh Chahl, Jin Young Choi, Jing Li, Jinqiao Wang, Jinqing Qi, Jinyoung Sung, Joakim Johnander, João F. Henriques, Jongwon Choi, Joost van de Weijer, Jorge Rodríguez Herranz, José M. Martínez, Josef Kittler, Junfei Zhuang, Junyu Gao, Klemen Grm, Lichao Zhang, Lijun Wang, Lingxiao Yang, Litu Rout, Liu Si, Luca Bertinetto, Lutao Chu, Manqiang Che, Mario Edoardo Maresca, Martin Danelljan, Ming-Hsuan Yang, Mohamed H. Abdelpakey, Mohamed Shehata, Myunggu Kang, Namhoon Lee, Ning Wang, Ondrej Miksik, Payman Moallem, Pablo Vicente-Moñivar, Pedro Senna, Peixia Li, Philip H. S. Torr, Priya Mariam Raju, Ruihe Qian, Qiang Wang, Qin Zhou, Qing Guo, Rafael Martin Nieto, Rama Krishna Sai Subrahmanyam Gorthi, Ran Tao, Richard Bowden, Richard M. Everson, Runling Wang, Sangdoo Yun, Seokeon Choi, Sergio Vivas, Shuai Bai, Shuangping Huang, Sihang Wu, Simon Hadfield, Siwen Wang, Stuart Golodetz, Ming Tang, Tianyang Xu, Tianzhu Zhang, Tobias Fischer, Vincenzo Santopietro, Vitomir Struc, Wei Wang, Wangmeng Zuo, Wei Feng, Wei Wu, Wei Zou, Weiming Hu, Wengang Zhou, Wenjun Zeng, Xiaofan Zhang, Xiaohe Wu, Xiao-Jun Wu, Xinmei Tian, Yan Li, Yan Lu, Yee Wei Law, Yi Wu, Yiannis Demiris, Yicai Yang, Yifan Jiao, Yuhong Li, Yunhua Zhang, Yuxuan Sun, Zheng Zhang, Zheng Zhu, Zhenhua Feng, Zhihui Wang, Zhiqun He

ICCV 2015 Robust RGB-D Odometry Using Point and Line Features Yan Lu, Dezhen Song