Li, Zhen

88 publications

NeurIPS 2025 3D Gaussian Flats: Hybrid 2D/3D Photometric Scene Reconstruction Maria Taktasheva, Lily Goli, Alessandro Fiorini, Zhen Li, Daniel Rebain, Andrea Tagliasacchi

ICCV 2025 AR-1-to-3: Single Image to Consistent 3D Object via Next-View Prediction Xuying Zhang, Yupeng Zhou, Kai Wang, Yikai Wang, Zhen Li, Shaohui Jiao, Daquan Zhou, Qibin Hou, Ming-Ming Cheng

NeurIPS 2025 AffordBot: 3D Fine-Grained Embodied Reasoning via Multimodal Large Language Models Xinyi Wang, Xun Yang, Yanlong Xu, Yuchen Wu, Zhen Li, Na Zhao

NeurIPS 2025 AgentTTS: Large Language Model Agent for Test-Time Compute-Optimal Scaling Strategy in Complex Tasks Fali Wang, Hui Liu, Zhenwei Dai, Jingying Zeng, Zhiwei Zhang, Zongyu Wu, Chen Luo, Zhen Li, Xianfeng Tang, Qi He, Suhang Wang

AAAI 2025 Consistency of Compositional Generalization Across Multiple Levels Chuanhao Li, Zhen Li, Chenchen Jing, Xiaomeng Fan, Wenbo Ye, Yuwei Wu, Yunde Jia

CVPR 2025 DSPNet: Dual-Vision Scene Perception for Robust 3D Question Answering Jingzhou Luo, Yang Liu, Weixing Chen, Zhen Li, Yaowei Wang, Guanbin Li, Liang Lin

CVPR 2025 DriveGEN: Generalized and Robust 3D Detection in Driving via Controllable Text-to-Image Diffusion Generation Hongbin Lin, Zilu Guo, Yifan Zhang, Shuaicheng Niu, Yafeng Li, Ruimao Zhang, Shuguang Cui, Zhen Li

CVPR 2025 Empowering Large Language Models with 3D Situation Awareness Zhihao Yuan, Yibo Peng, Jinke Ren, Yinghong Liao, Yatong Han, Chun-Mei Feng, Hengshuang Zhao, Guanbin Li, Shuguang Cui, Zhen Li

ICLR 2025 GUI-World: A Video Benchmark and Dataset for Multimodal GUI-Oriented Understanding Dongping Chen, Yue Huang, Siyuan Wu, Jingyu Tang, Huichi Zhou, Qihui Zhang, Zhigang He, Yilin Bai, Chujie Gao, Liuyi Chen, Yiqiang Li, Chenlong Wang, Yue Yu, Tianshuo Zhou, Zhen Li, Yi Gui, Yao Wan, Pan Zhou, Jianfeng Gao, Lichao Sun

CVPR 2025 K-LoRA: Unlocking Training-Free Fusion of Any Subject and Style LoRAs Ziheng Ouyang, Zhen Li, Qibin Hou

ICCV 2025 Lumina-Image 2.0: A Unified and Efficient Image Generative Framework Qi Qin, Le Zhuo, Yi Xin, Ruoyi Du, Zhen Li, Bin Fu, Yiting Lu, Xinyue Li, Dongyang Liu, Xiangyang Zhu, Will Beddow, Erwann Millon, Victor Perez, Wenhai Wang, Yu Qiao, Bo Zhang, Xiaohong Liu, Hongsheng Li, Chang Xu, Peng Gao

IJCAI 2025 Multi-Sourced Compositional Generalization in Visual Question Answering Chuanhao Li, Wenbo Ye, Zhen Li, Yuwei Wu, Yunde Jia

NeurIPS 2025 SQS: Enhancing Sparse Perception Models via Query-Based Splatting in Autonomous Driving Haiming Zhang, Yiyao Zhu, Wending Zhou, Xu Yan, Yingjie Cai, Bingbing Liu, Shuguang Cui, Zhen Li

NeurIPS 2025 Sekai: A Video Dataset Towards World Exploration Zhen Li, Chuanhao Li, Xiaofeng Mao, Shaoheng Lin, Ming Li, Shitian Zhao, xu Zhao Pan, Xinyue Li, Yukang Feng, Jianwen Sun, Zizhen Li, Fanrui Zhang, Jiaxin Ai, Zhixiang Wang, Yuwei Wu, Tong He, Yunde Jia, Kaipeng Zhang

AAAI 2025 Topo2Seq: Enhanced Topology Reasoning via Topology Sequence Learning Yiming Yang, Yueru Luo, Bingkun He, Erlong Li, Zhipeng Cao, Chao Zheng, Shuqi Mei, Zhen Li

AAAI 2025 VQA4CIR: Boosting Composed Image Retrieval with Visual Question Answering Chun-Mei Feng, Yang Bai, Tao Luo, Zhen Li, Salman H. Khan, Wangmeng Zuo, Rick Siow Mong Goh, Yong Liu

CVPR 2025 VisionPAD: A Vision-Centric Pre-Training Paradigm for Autonomous Driving Haiming Zhang, Wending Zhou, Yiyao Zhu, Xu Yan, Jiantao Gao, Dongfeng Bai, Yingjie Cai, Bingbing Liu, Shuguang Cui, Zhen Li

ICCV 2025 VisualCloze: A Universal Image Generation Framework via Visual In-Context Learning Zhong-Yu Li, Ruoyi Du, Juncheng Yan, Le Zhuo, Zhen Li, Peng Gao, Zhanyu Ma, Ming-Ming Cheng

ECCV 2024 Compositional Substitutivity of Visual Reasoning for Visual Question Answering Chuanhao Li, Zhen Li, Chenchen Jing, Yuwei Wu, Mingliang Zhai, Yunde Jia

CVPRW 2024 Cross-View Aggregation Network for Stereo Image Super-Resolution Zhitao Chen, Tao Lu, Kanghui Zhao, Bolin Zhu, Zhen Li, Jiaming Wang, Yanduo Zhang

AAAI 2024 CrossBind: Collaborative Cross-Modal Identification of Protein Nucleic-Acid-Binding Residues Linglin Jing, Sheng Xu, Yifan Wang, Yuzhe Zhou, Tao Shen, Zhigang Ji, Hui Fang, Zhen Li, Siqi Sun

ICLR 2024 DV-3DLane: End-to-End Multi-Modal 3D Lane Detection with Dual-View Representation Yueru Luo, Shuguang Cui, Zhen Li

NeurIPSW 2024 GUI-WORLD: A GUI-Oriented Video Dataset for Multimodal LLM-Based Agents Dongping Chen, Yue Huang, Siyuan Wu, Jingyu Tang, Huichi Zhou, Qihui Zhang, Zhigang He, Yilin Bai, Chujie Gao, Liuyi Chen, Yiqiang Li, Chenlong Wang, Yue Yu, Tianshuo Zhou, Zhen Li, Yi Gui, Yao Wan, Pan Zhou, Jianfeng Gao, Lichao Sun

ECCV 2024 MonoTTA: Fully Test-Time Adaptation for Monocular 3D Object Detection Hongbin Lin, Yifan Zhang, Shuaicheng Niu, Shuguang Cui, Zhen Li

CVPR 2024 PhotoMaker: Customizing Realistic Human Photos via Stacked ID Embedding Zhen Li, Mingdeng Cao, Xintao Wang, Zhongang Qi, Ming-Ming Cheng, Ying Shan

AAAI 2024 RadOcc: Learning Cross-Modality Occupancy Knowledge Through Rendering Assisted Distillation Haiming Zhang, Xu Yan, Dongfeng Bai, Jiantao Gao, Pan Wang, Bingbing Liu, Shuguang Cui, Zhen Li

NeurIPS 2024 SearchLVLMs: A Plug-and-Play Framework for Augmenting Large Vision-Language Models by Searching Up-to-Date Internet Knowledge Chuanhao Li, Zhen Li, Chenchen Jing, Shuo Liu, Wenqi Shao, Yuwei Wu, Ping Luo, Yu Qiao, Kaipeng Zhang

NeurIPS 2024 Towards Flexible 3D Perception: Object-Centric Occupancy Completion Augments 3D Object Detection Chaoda Zheng, Feng Wang, Naiyan Wang, Shuguang Cui, Zhen Li

ICML 2024 Unified Generation, Reconstruction, and Representation: Generalized Diffusion with Adaptive Latent Encoding-Decoding Guangyi Liu, Yu Wang, Zeyu Feng, Qiyu Wu, Liping Tang, Yuan Gao, Zhen Li, Shuguang Cui, Julian Mcauley, Zichao Yang, Eric P. Xing, Zhiting Hu

CVPR 2024 Visual Programming for Zero-Shot Open-Vocabulary 3D Visual Grounding Zhihao Yuan, Jinke Ren, Chun-Mei Feng, Hengshuang Zhao, Shuguang Cui, Zhen Li

AAAI 2024 WeakPCSOD: Overcoming the Bias of Box Annotations for Weakly Supervised Point Cloud Salient Object Detection Jun Wei, S. Kevin Zhou, Shuguang Cui, Zhen Li

AAAI 2024 X4D-SceneFormer: Enhanced Scene Understanding on 4D Point Cloud Videos Through Cross-Modal Knowledge Transfer Linglin Jing, Ying Xue, Xu Yan, Chaoda Zheng, Dong Wang, Ruimao Zhang, Zhigang Wang, Hui Fang, Bin Zhao, Zhen Li

CVPR 2023 AMT: All-Pairs Multi-Field Transforms for Efficient Frame Interpolation Zhen Li, Zuo-Liang Zhu, Ling-Hao Han, Qibin Hou, Chun-Le Guo, Ming-Ming Cheng

NeurIPS 2023 Amazon-M2: A Multilingual Multi-Locale Shopping Session Dataset for Recommendation and Text Generation Wei Jin, Haitao Mao, Zheng Li, Haoming Jiang, Chen Luo, Hongzhi Wen, Haoyu Han, Hanqing Lu, Zhengyang Wang, Ruirui Li, Zhen Li, Monica Cheng, Rahul Goutam, Haiyang Zhang, Karthik Subbian, Suhang Wang, Yizhou Sun, Jiliang Tang, Bing Yin, Xianfeng Tang

CVPR 2023 BEV@DC: Bird's-Eye View Assisted Training for Depth Completion Wending Zhou, Xu Yan, Yinghong Liao, Yuankai Lin, Jin Huang, Gangming Zhao, Shuguang Cui, Zhen Li

AAAI 2023 CowClip: Reducing CTR Prediction Model Training Time from 12 Hours to 10 Minutes on 1 GPU Zangwei Zheng, Pengtai Xu, Xuan Zou, Da Tang, Zhen Li, Chenguang Xi, Peng Wu, Leqi Zou, Yijie Zhu, Ming Chen, Xiangzhuo Ding, Fuzhao Xue, Ziheng Qin, Youlong Cheng, Yang You

CVPR 2023 DNF: Decouple and Feedback Network for Seeing in the Dark Xin Jin, Ling-Hao Han, Zhen Li, Chun-Le Guo, Zhi Chai, Chongyi Li

CVPR 2023 Exploring the Effect of Primitives for Compositional Generalization in Vision-and-Language Chuanhao Li, Zhen Li, Chenchen Jing, Yunde Jia, Yuwei Wu

AAAI 2023 Fair-CDA: Continuous and Directional Augmentation for Group Fairness Rui Sun, Fengwei Zhou, Zhenhua Dong, Chuanlong Xie, Lanqing Hong, Jiawei Li, Rui Zhang, Zhen Li, Zhenguo Li

AAAI 2023 Geometry-Aware Network for Domain Adaptive Semantic Segmentation Yinghong Liao, Wending Zhou, Xu Yan, Zhen Li, Yizhou Yu, Shuguang Cui

ICCV 2023 LATR: 3D Lane Detection from Monocular Images with Transformer Yueru Luo, Chaoda Zheng, Xu Yan, Tang Kun, Chao Zheng, Shuguang Cui, Zhen Li

CVPR 2023 Learning Transformation-Predictive Representations for Detection and Description of Local Features Zihao Wang, Chunxu Wu, Yifei Yang, Zhen Li

AAAI 2023 MMTN: Multi-Modal Memory Transformer Network for Image-Report Consistent Medical Report Generation Yiming Cao, Lizhen Cui, Lei Zhang, Fuqiang Yu, Zhen Li, Yonghui Xu

CVPR 2023 Multi-View Inverse Rendering for Large-Scale Real-World Indoor Scenes Zhen Li, Lingli Wang, Mofang Cheng, Cihui Pan, Jiaqi Yang

ICCV 2023 RankMatch: Fostering Confidence and Consistency in Learning with Noisy Labels Ziyi Zhang, Weikai Chen, Chaowei Fang, Zhen Li, Lechao Chen, Liang Lin, Guanbin Li

ICCV 2023 SRFormer: Permuted Self-Attention for Single Image Super-Resolution Yupeng Zhou, Zhen Li, Chun-Le Guo, Song Bai, Ming-Ming Cheng, Qibin Hou

CVPR 2023 Semantic Human Parsing via Scalable Semantic Transfer over Multiple Label Domains Jie Yang, Chaoqun Wang, Zhen Li, Junle Wang, Ruimao Zhang

ICCV 2023 SkeletonMAE: Graph-Based Masked Autoencoder for Skeleton Sequence Pre-Training Hong Yan, Yang Liu, Yushen Wei, Zhen Li, Guanbin Li, Liang Lin

NeurIPS 2023 Small Total-Cost Constraints in Contextual Bandits with Knapsacks, with Application to Fairness Evgenii Chzhen, Christophe Giraud, Zhen Li, Gilles Stoltz

ICCV 2023 SupFusion: Supervised LiDAR-Camera Fusion for 3D Object Detection Yiran Qin, Chaoqun Wang, Zijian Kang, Ningning Ma, Zhen Li, Ruimao Zhang

ECCV 2022 2DPASS: 2D Priors Assisted Semantic Segmentation on LiDAR Point Clouds Xu Yan, Jiantao Gao, Chaoda Zheng, Chao Zheng, Ruimao Zhang, Shuguang Cui, Zhen Li

NeurIPS 2022 AMOS: A Large-Scale Abdominal Multi-Organ Benchmark for Versatile Medical Image Segmentation Yuanfeng Ji, Haotian Bai, Chongjian Ge, Jie Yang, Ye Zhu, Ruimao Zhang, Zhen Li, Lingyan Zhanng, Wanling Ma, Xiang Wan, Ping Luo

JMLR 2022 An Error Analysis of Generative Adversarial Networks for Learning Distributions Jian Huang, Yuling Jiao, Zhen Li, Shiao Liu, Yang Wang, Yunfei Yang

CVPR 2022 Beyond 3D Siamese Tracking: A Motion-Centric Paradigm for 3D Single Object Tracking in Point Clouds Chaoda Zheng, Xu Yan, Haiming Zhang, Baoyuan Wang, Shenghui Cheng, Shuguang Cui, Zhen Li

AAAI 2022 Contact-Distil: Boosting Low Homologous Protein Contact mAP Prediction by Self-Supervised Distillation Qin Wang, Jiayang Chen, Yuzhe Zhou, Yu Li, Liangzhen Zheng, Sheng Wang, Zhen Li, Shuguang Cui

NeurIPS 2022 Contextual Bandits with Knapsacks for a Conversion Model Zhen Li, Gilles Stoltz

NeurIPS 2022 Divide and Contrast: Source-Free Domain Adaptation via Adaptive Contrastive Learning Ziyi Zhang, Weikai Chen, Hui Cheng, Zhen Li, Siyuan Li, Liang Lin, Guanbin Li

NeurIPS 2022 Let Images Give You More: Point Cloud Cross-Modal Training for Shape Analysis Xu Yan, Heshen Zhan, Chaoda Zheng, Jiantao Gao, Ruimao Zhang, Shuguang Cui, Zhen Li

CVPR 2022 PhyIR: Physics-Based Inverse Rendering for Panoramic Indoor Images Zhen Li, Lingli Wang, Xiang Huang, Cihui Pan, Jiaqi Yang

CVPR 2022 Towards an End-to-End Framework for Flow-Guided Video Inpainting Zhen Li, Cheng-Ze Lu, Jianhua Qin, Chun-Le Guo, Ming-Ming Cheng

ECCV 2022 Weakly Supervised Object Localization Through Inter-Class Feature Similarity and Intra-Class Appearance Consistency Jun Wei, Sheng Wang, S. Kevin Zhou, Shuguang Cui, Zhen Li

CVPR 2022 X-Trans2Cap: Cross-Modal Knowledge Transfer Using Transformer for 3D Dense Captioning Zhihao Yuan, Xu Yan, Yinghong Liao, Yao Guo, Guanbin Li, Shuguang Cui, Zhen Li

IJCAI 2021 Adaptive Residue-Wise Profile Fusion for Low Homologous Protein Secondary Structure Prediction Using External Knowledge Qin Wang, Jun Wei, Boyuan Wang, Zhen Li, Sheng Wang, Shuguang Cui

ICCV 2021 Box-Aware Feature Enhancement for Single Object Tracking on Point Clouds Chaoda Zheng, Xu Yan, Jiantao Gao, Weibing Zhao, Wei Zhang, Zhen Li, Shuguang Cui

ECML-PKDD 2021 CQNet: A Clustering-Based Quadruplet Network for Decentralized Application Classification via Encrypted Traffic Yu Wang, Gang Xiong, Chang Liu, Zhen Li, Mingxin Cui, Gaopeng Gou

ICCV 2021 Free-Form Description Guided 3D Visual Graph Network for Object Grounding in Point Cloud Mingtao Feng, Zhen Li, Qi Li, Liang Zhang, XiangDong Zhang, Guangming Zhu, Hui Zhang, Yaonan Wang, Ajmal Mian

ICCV 2021 InstanceRefer: Cooperative Holistic Understanding for Visual Grounding on Point Clouds Through Instance Multi-Level Contextual Referring Zhihao Yuan, Xu Yan, Yinghong Liao, Ruimao Zhang, Sheng Wang, Zhen Li, Shuguang Cui

IJCAI 2021 Local Representation Is Not Enough: Soft Point-Wise Transformer for Descriptor and Detector of Local Features Zihao Wang, Xueyi Li, Zhen Li

AAAI 2021 PSSM-Distil: Protein Secondary Structure Prediction (PSSP) on Low-Quality PSSM by Knowledge Distillation with Contrastive Learning Qin Wang, Boyuan Wang, Zhenlei Xu, Jiaxiang Wu, Peilin Zhao, Zhen Li, Sheng Wang, Junzhou Huang, Shuguang Cui

IJCAI 2021 PointLIE: Locally Invertible Embedding for Point Cloud Sampling and Recovery Weibing Zhao, Xu Yan, Jiantao Gao, Ruimao Zhang, Jiayan Zhang, Zhen Li, Song Wu, Shuguang Cui

ICML 2021 Scaling up Visual and Vision-Language Representation Learning with Noisy Text Supervision Chao Jia, Yinfei Yang, Ye Xia, Yi-Ting Chen, Zarana Parekh, Hieu Pham, Quoc Le, Yun-Hsuan Sung, Zhen Li, Tom Duerig

CVPR 2021 Shallow Feature Matters for Weakly Supervised Object Localization Jun Wei, Qin Wang, Zhen Li, Sheng Wang, S. Kevin Zhou, Shuguang Cui

AAAI 2021 Sparse Single Sweep LiDAR Point Cloud Segmentation via Learning Contextual Shape Priors from Scene Completion Xu Yan, Jiantao Gao, Jie Li, Ruimao Zhang, Zhen Li, Rui Huang, Shuguang Cui

CVPR 2021 Temporal Modulation Network for Controllable Space-Time Video Super-Resolution Gang Xu, Jun Xu, Zhen Li, Liang Wang, Xing Sun, Ming-Ming Cheng

IJCAI 2020 BARNet: Bilinear Attention Network with Adaptive Receptive Fields for Surgical Instrument Segmentation Zhen-Liang Ni, Gui-Bin Bian, Guan'an Wang, Xiao-Hu Zhou, Zeng-Guang Hou, Xiao-Liang Xie, Zhen Li, Yu-Han Wang

ECCV 2020 Towards Content-Independent Multi-Reference Super-Resolution: Adaptive Pattern Matching and Feature Aggregation Xu Yan, Weibing Zhao, Kun Yuan, Ruimao Zhang, Zhen Li, Shuguang Cui

NeurIPS 2018 Deep Neural Nets with Interpolating Function as Output Activation Bao Wang, Xiyang Luo, Zhen Li, Wei Zhu, Zuoqiang Shi, Stanley Osher

ICCV 2017 High-Resolution Shape Completion Using Deep Neural Networks for Global Structure and Local Geometry Inference Xiaoguang Han, Zhen Li, Haibin Huang, Evangelos Kalogerakis, Yizhou Yu

ACML 2017 Learning Deep Semantic Embeddings for Cross-Modal Retrieval Cuicui Kang, Shengcai Liao, Zhen Li, Zigang Cao, Gang Xiong

CVPR 2016 Blockout: Dynamic Model Selection for Hierarchical Deep Networks Calvin Murdock, Zhen Li, Howard Zhou, Tom Duerig

ECCV 2016 LSTM-CF: Unifying Context Modeling and Fusion with LSTMs for RGB-D Scene Labeling Zhen Li, Yukang Gan, Xiaodan Liang, Yizhou Yu, Hui Cheng, Liang Lin

IJCAI 2016 Protein Secondary Structure Prediction Using Cascaded Convolutional and Recurrent Neural Networks Zhen Li, Yizhou Yu

CVPR 2015 Learning Semantic Relationships for Better Action Retrieval in Images Vignesh Ramanathan, Congcong Li, Jia Deng, Wei Han, Zhen Li, Kunlong Gu, Yang Song, Samy Bengio, Charles Rosenberg, Li Fei-Fei

CVPR 2013 Learning Locally-Adaptive Decision Functions for Person Verification Zhen Li, Shiyu Chang, Feng Liang, Thomas S. Huang, Liangliang Cao, John R. Smith

CVPRW 2012 Beyond Mahalanobis Distance: Learning Second-Order Discriminant Function for People Verification Zhen Li, Liangliang Cao, Shiyu Chang, John R. Smith, Thomas S. Huang

NeurIPS 2011 Learning to Search Efficiently in High Dimensions Zhen Li, Huazhong Ning, Liangliang Cao, Tong Zhang, Yihong Gong, Thomas S. Huang

CVPRW 2010 A Robust Framework for Multiview Age Estimation Zhen Li, Yun Fu, Thomas S. Huang

ICCV 2009 Hierarchical Gaussianization for Image Classification Xi Zhou, Na Cui, Zhen Li, Feng Liang, Thomas S. Huang