Chen, Kai

145 publications

CVPR 2025 Auto Cherry-Picker: Learning from High-Quality Generative Data Driven by Language Yicheng Chen, Xiangtai Li, Yining Li, Yanhong Zeng, Jianzong Wu, Xiangyu Zhao, Kai Chen

WACV 2025 Automated Evaluation of Large Vision-Language Models on Self-Driving Corner Cases Kai Chen, Yanze Li, Wenhua Zhang, Yanxin Liu, Pengxiang Li, Ruiyuan Gao, Lanqing Hong, Meng Tian, Xinhai Zhao, Zhenguo Li, Dit-Yan Yeung, Huchuan Lu, Xu Jia

ICLRW 2025 Benchmarking Differentially Private Tabular Data Synthesis Algorithms Kai Chen, Xiaochen Li, Chen Gong, Ryan McKenna, Tianhao Wang

WACV 2025 Calib3D: Calibrating Model Preferences for Reliable 3D Scene Understanding Lingdong Kong, Xiang Xu, Jun Cen, Wenwei Zhang, Liang Pan, Kai Chen, Ziwei Liu

NeurIPS 2025 Contact mAP Transfer with Conditional Diffusion Model for Generalizable Dexterous Grasp Generation Yiyao Ma, Kai Chen, Kexin Zheng, Qi Dou

ICCV 2025 Creation-MMBench: Assessing Context-Aware Creative Intelligence in MLLMs Xinyu Fang, Zhijian Chen, Kai Lan, Lixin Ma, Shengyuan Ding, Yingji Liang, Xiangyu Zhao, Farong Wen, Zicheng Zhang, Guofeng Zhang, Haodong Duan, Kai Chen, Dahua Lin

ICLR 2025 CryoGEN: Generative Energy-Based Models for Cryogenic Electron Tomography Reconstruction Yunfei Teng, Yuxuan Ren, Kai Chen, Xi Chen, Zhaoming Chen, Qiwei Ye

AAAI 2025 DuMo: Dual Encoder Modulation Network for Precise Concept Erasure Feng Han, Kai Chen, Chao Gong, Zhipeng Wei, Jingjing Chen, Yu-Gang Jiang

CVPR 2025 EMOVA: Empowering Language Models to See, Hear and Speak with Vivid Emotions Kai Chen, Yunhao Gou, Runhui Huang, Zhili Liu, Daxin Tan, Jing Xu, Chunwei Wang, Yi Zhu, Yihan Zeng, Kuo Yang, Dingdong Wang, Kun Xiang, Haoyuan Li, Haoli Bai, Jianhua Han, Xiaohui Li, Weike Jin, Nian Xie, Yu Zhang, James T. Kwok, Hengshuang Zhao, Xiaodan Liang, Dit-Yan Yeung, Xiao Chen, Zhenguo Li, Wei Zhang, Qun Liu, Lanqing Hong, Lu Hou, Hang Xu

ICLRW 2025 Extending Prot2Token: Aligning Protein Language Models for Unified and Diverse Protein Prediction Tasks Mahdi Pourmirzaei, Ye Han, Farzaneh Esmaili, Mohammadreza Pourmirzaeioliaei, Salhuldin Alqarghuli, Kai Chen, Dong Xu

ICLR 2025 FaceShot: Bring Any Character into Life Junyao Gao, Yanan Sun, Fei Shen, Xin Jiang, Zhening Xing, Kai Chen, Cairong Zhao

ICLRW 2025 Follow Hamiltonian Leader: An Efficient Energy-Guided Sampling Method Yunfei Teng, Sixin Zhang, Yao Li, Kai Chen, Di He, Qiwei Ye

CVPR 2025 Hybrid Reciprocal Transformer with Triplet Feature Alignment for Scene Graph Generation Jiawei Fu, Tiantian Zhang, Kai Chen, Qi Dou

ICCV 2025 Information Density Principle for MLLM Benchmarks Chunyi Li, Xiaozhe Li, Zicheng Zhang, Yuan Tian, Ziheng Jia, Xiaohong Liu, Xiongkuo Min, Jia Wang, Haodong Duan, Kai Chen, Guangtao Zhai

AAAI 2025 LLM-DR: A Novel LLM-Aided Diffusion Model for Rule Generation on Temporal Knowledge Graphs Kai Chen, Xin Song, Ye Wang, Liqun Gao, Aiping Li, Xiaojuan Zhao, Bin Zhou, Yalong Xie

ICCV 2025 MagicDrive-V2: High-Resolution Long Video Generation for Autonomous Driving with Adaptive Control Ruiyuan Gao, Kai Chen, Bo Xiao, Lanqing Hong, Zhenguo Li, Qiang Xu

ICLR 2025 Mask-DPO: Generalizable Fine-Grained Factuality Alignment of LLMs Yuzhe Gu, Wenwei Zhang, Chengqi Lyu, Dahua Lin, Kai Chen

NeurIPS 2025 Memory Decoder: A Pretrained, Plug-and-Play Memory for Large Language Models Jiaqi Cao, Jiarui Wang, Rubin Wei, Qipeng Guo, Kai Chen, Bowen Zhou, Zhouhan Lin

ICLR 2025 MindSearch: Mimicking Human Minds Elicits Deep AI Searcher Zehui Chen, Kuikun Liu, Qiuchen Wang, Jiangning Liu, Wenwei Zhang, Kai Chen, Feng Zhao

NeurIPS 2025 Mixing Expert Knowledge: Bring Human Thoughts Back to the Game of Go Yichuan Ma, Linyang Li, Yongkang Chen, Peiji Li, Jiasheng Ye, Qipeng Guo, Dahua Lin, Kai Chen

ICCV 2025 MotionShot: Adaptive Motion Transfer Across Arbitrary Objects for Text-to-Video Generation Yanchen Liu, Yanan Sun, Zhening Xing, Junyao Gao, Kai Chen, Wenjie Pei

CVPRW 2025 NTIRE 2025 Challenge on Short-Form UGC Video Quality Assessment and Enhancement: Methods and Results Xin Li, Kun Yuan, Bingchen Li, Fengbin Guan, Yizhen Shao, Zihao Yu, Xijun Wang, Yiting Lu, Wei Luo, Suhang Yao, Ming Sun, Chao Zhou, Zhibo Chen, Radu Timofte, Yabin Zhang, Ao-Xiang Zhang, Tianwu Zhi, Jianzhao Liu, Yang Li, Jingwen Xu, Yiting Liao, Yushen Zuo, Mingyang Wu, Renjie Li, Shengyun Zhong, Zhengzhong Tu, Yufan Liu, Xiangguang Chen, Zuowei Cao, Minhao Tang, Shan Liu, Kexin Zhang, Jingfen Xie, Yan Wang, Kai Chen, Shijie Zhao, Yunchen Zhang, Xiangkai Xu, Hong Gao, Ji Shi, Yiming Bao, Xiugang Dong, Xiangsheng Zhou, Yaofeng Tu, Ying Liang, Yiwen Wang, Xinning Chai, Yuxuan Zhang, Zhengxue Cheng, Yingsheng Qin, Yucai Yang, Rong Xie, Li Song, Wei Sun, Kang Fu, Linhan Cao, Dandan Zhu, Kaiwei Zhang, Yucheng Zhu, Zicheng Zhang, Menghan Hu, Xiongkuo Min, Guangtao Zhai, Zhi Jin, Jiawei Wu, Wei Wang, Wenjian Zhang, Yuhai Lan, Gaoxiong Yi, Hengyuan Na, Wang Luo, Di Wu, Mingyin Bai, Jiawang Du, Zilong Lu, Zhenyu Jiang, Hui Zeng, Ziguan Cui, Zongliang Gan, Guijin Tang, Xinglin Xie, Kehuan Song, Xiaoqiang Lu, Licheng Jiao, Fang Liu, Xu Liu, Puhua Chen, Ha Thu Nguyen, Katrien De Moor, Seyed Ali Amirshahi, Mohamed-Chaker Larabi, Qi Tang, Linfeng He, Zhiyong Gao, Zixuan Gao, Guohua Zhang, Zhiye Huang, Yi Deng, Qingmiao Jiang, Lu Chen, Yi Yang, Xi Liao, Nourine Mohammed Nadir, Yuxuan Jiang, Qiang Zhu, Siyue Teng, Fan Zhang, Shuyuan Zhu, Bing Zeng, David Bull, Meiqin Liu, Chao Yao, Yao Zhao

CVPRW 2025 NTIRE 2025 Challenge on UGC Video Enhancement: Methods and Results Nickolay Safonov, Alexey Bryntsev, Andrey Moskalenko, Dmitry Kulikov, Dmitriy S. Vatolin, Radu Timofte, Haibo Lei, Qifan Gao, Qing Luo, Yaqing Li, Jie Song, Shaozhe Hao, Meisong Zheng, Jingyi Xu, Chengbin Wu, Jiahui Liu, Ying Chen, Xin Deng, Mai Xu, Peipei Liang, Jie Ma, Junjie Jin, Yingxue Pang, Fangzhou Luo, Kai Chen, Shijie Zhao, Mingyang Wu, Renjie Li, Yushen Zuo, Zhengzhong Tu, Shengyun Zhong

TMLR 2025 NeedleBench: Evaluating LLM Retrieval and Reasoning Across Varying Information Densities Mo Li, Songyang Zhang, Taolin Zhang, Haodong Duan, Yunxin Liu, Kai Chen

NeurIPS 2025 OOD-Barrier: Build a Middle-Barrier for Open-Set Single-Image Test Time Adaptation via Vision Language Models Boyang Peng, Sanqing Qu, Tianpei Zou, Fan Lu, Ya Wu, Kai Chen, Siheng Chen, Yong Wu, Guang Chen

ICCV 2025 PatchScaler: An Efficient Patch-Independent Diffusion Model for Image Super-Resolution Yong Liu, Hang Dong, Jinshan Pan, Qingji Dong, Kai Chen, Rongxiang Zhang, Lean Fu, Fei Wang

NeurIPS 2025 Pre-Trained Policy Discriminators Are General Reward Models Shihan Dou, Shichun Liu, Yuming Yang, Yicheng Zou, Yunhua Zhou, Shuhao Xing, Chenhao Huang, Qiming Ge, Haijun Lv, Demin Song, Songyang Gao, Chengqi Lyu, Enyu Zhou, Honglin Guo, Zhiheng Xi, Qipeng Guo, Wenwei Zhang, Tao Gui, Qi Zhang, Xipeng Qiu, Xuanjing Huang, Kai Chen

AAAI 2025 Promptable Anomaly Segmentation with SAM Through Self-Perception Tuning Hui-Yue Yang, Hui Chen, Ao Wang, Kai Chen, Zijia Lin, Yongliang Tang, Pengcheng Gao, Yuming Quan, Jungong Han, Guiguang Ding

ICLR 2025 RMP-SAM: Towards Real-Time Multi-Purpose Segment Anything Shilin Xu, Haobo Yuan, Qingyu Shi, Lu Qi, Jingbo Wang, Yibo Yang, Yining Li, Kai Chen, Yunhai Tong, Bernard Ghanem, Xiangtai Li, Ming-Hsuan Yang

AAAI 2025 RepeatLeakage: Leak Prompts from Repeating as Large Language Model Is a Good Repeater Yu Peng, Lijie Zhang, Peizhuo Lv, Kai Chen

NeurIPS 2025 Rethinking Verification for LLM Code Generation: From Generation to Testing Zihan Ma, Taolin Zhang, Maosongcao, Junnan Liu, Wenwei Zhang, Minnan Luo, Songyang Zhang, Kai Chen

ICLRW 2025 SWE-Fixer: Training Open-Source LLMs for Effective and Efficient GitHub Issue Resolution Chengxing Xie, Bowen Li, Chang Gao, He Du, Wai Lam, Difan Zou, Kai Chen

AAAI 2025 Semantic-Guided Masked Mutual Learning for Multi-Modal Brain Tumor Segmentation with Arbitrary Missing Modalities Guoyan Liang, Qin Zhou, Zhe Wang, Jingyuan Chen, Lin Gu, Chang Yao, Sai Wu, Bingcang Huang, Kai Chen

NeurIPS 2025 Semi-Off-Policy Reinforcement Learning for Vision-Language Slow-Thinking Reasoning Junhao Shen, Haiteng Zhao, Yuzhe Gu, Songyang Gao, Kuikun Liu, Haian Huang, Jianfei Gao, Dahua Lin, Wenwei Zhang, Kai Chen

AAAI 2025 Social Recommendation via Graph-Level Counterfactual Augmentation Yinxuan Huang, Ke Liang, Yanyi Huang, Xiang Zeng, Kai Chen, Bin Zhou

CVPR 2025 SocialMOIF: Multi-Order Intention Fusion for Pedestrian Trajectory Prediction Kai Chen, Xiaodong Zhao, Yujie Huang, Guoyu Fang, Xiao Song, Ruiping Wang, Ziyuan Wang

NeurIPS 2025 Sparse Meets Dense: Unified Generative Recommendations with Cascaded Sparse-Dense Representations Yuhao Yang, Zhi Ji, Zhaopeng Li, Yi Li, Zhonglin Mo, Yue Ding, Kai Chen, Zijian Zhang, Jie Li, Shuanglong Li, Liu Lin

CVPR 2025 TAPT: Test-Time Adversarial Prompt Tuning for Robust Inference in Vision-Language Models Xin Wang, Kai Chen, Jiaming Zhang, Jingjing Chen, Xingjun Ma

WACV 2025 TrackDiffusion: Tracklet-Conditioned Video Generation via Diffusion Models Pengxiang Li, Kai Chen, Zhili Liu, Ruiyuan Gao, Lanqing Hong, Dit-Yan Yeung, Huchuan Lu, Xu Jia

TMLR 2025 Unified Triplet-Level Hallucination Evaluation for Large Vision-Language Models Junjie Wu, Tsz Ting Chung, Kai Chen, Dit-Yan Yeung

ECCV 2024 4D Contrastive Superflows Are Dense 3D Representation Learners Xiang Xu, Lingdong Kong, Hui Shuai, Wenwei Zhang, Liang Pan, Kai Chen, Ziwei Liu, Qingshan Liu

ECCV 2024 A Task Is Worth One Word: Learning with Task Prompts for High-Quality Versatile Image Inpainting Junhao Zhuang, Yanhong Zeng, Wenran Liu, Chun Yuan, Kai Chen

NeurIPS 2024 ANAH-V2: Scaling Analytical Hallucination Annotation of Large Language Models Yuzhe Gu, Ziwei Ji, Wenwei Zhang, Chengqi Lyu, Dahua Lin, Kai Chen

NeurIPS 2024 AlchemistCoder: Harmonizing and Eliciting Code Capability by Hindsight Tuning on Multi-Source Data Zifan Song, Yudong Wang, Wenwei Zhang, Kuikun Liu, Chengqi Lyu, Demin Song, Qipeng Guo, Hang Yan, Dahua Lin, Kai Chen, Cairong Zhao

ECCV 2024 AnyControl: Create Your Artwork with Versatile Control on Text-to-Image Generation Yanan Sun, Yanchen Liu, Yinhao Tang, Wenjie Pei, Kai Chen

ICML 2024 Can AI Assistants Know What They Don’t Know? Qinyuan Cheng, Tianxiang Sun, Xiangyang Liu, Wenwei Zhang, Zhangyue Yin, Shimin Li, Linyang Li, Zhengfu He, Kai Chen, Xipeng Qiu

NeurIPS 2024 CriticEval: Evaluating Large-Scale Language Model as Critic Tian Lan, Wenwei Zhang, Chen Xu, Heyan Huang, Dahua Lin, Kai Chen, Xian-Ling Mao

AAAI 2024 DataElixir: Purifying Poisoned Dataset to Mitigate Backdoor Attacks via Diffusion Models Jiachen Zhou, Peizhuo Lv, Yibing Lan, Guozhu Meng, Kai Chen, Hualong Ma

CVPR 2024 DetDiffusion: Synergizing Generative and Perceptive Models for Enhanced Data Generation and Perception Yibo Wang, Ruiyuan Gao, Kai Chen, Kaiqiang Zhou, Yingjie Cai, Lanqing Hong, Zhenguo Li, Lihui Jiang, Dit-Yan Yeung, Qiang Xu, Kai Zhang

ICML 2024 Differentiable Model Scaling Using Differentiable Topk Kai Liu, Ruohui Wang, Jianfei Gao, Kai Chen

NeurIPS 2024 Efficient LLM Jailbreak via Adaptive Dense-to-Sparse Constrained Optimization Kai Hu, Weichen Yu, Yining Li, Tianjun Yao, Xiang Li, Wenhe Liu, Lijun Yu, Zhiqiang Shen, Kai Chen, Matt Fredrikson

CVPR 2024 EmbodiedScan: A Holistic Multi-Modal 3D Perception Suite Towards Embodied AI Tai Wang, Xiaohan Mao, Chenming Zhu, Runsen Xu, Ruiyuan Lyu, Peisen Li, Xiao Chen, Wenwei Zhang, Kai Chen, Tianfan Xue, Xihui Liu, Cewu Lu, Dahua Lin, Jiangmiao Pang

AAAI 2024 Everything2Motion: Synchronizing Diverse Inputs via a Unified Framework for Human Motion Synthesis Zhaoxin Fan, Longbin Ji, Pengxin Xu, Fan Shen, Kai Chen

ECCV 2024 Eyes Closed, Safety on: Protecting Multimodal LLMs via Image-to-Text Transformation Yunhao Gou, Kai Chen, Zhili Liu, Lanqing Hong, Hang Xu, Zhenguo Li, Dit-Yan Yeung, James Kwok, Yu Zhang

CVPR 2024 From Pixels to Graphs: Open-Vocabulary Scene Graph Generation with Vision-Language Models Rongjie Li, Songyang Zhang, Dahua Lin, Kai Chen, Xuming He

ECCVW 2024 GPT4RoI: Instruction Tuning Large Language Model on Region-of-Interest Shilong Zhang, Peize Sun, Shoufa Chen, Min Xiao, Wenqi Shao, Wenwei Zhang, Yu Liu, Kai Chen, Ping Luo

NeurIPS 2024 GTA: A Benchmark for General Tool Agents Jize Wang, Zerun Ma, Yining Li, Songyang Zhang, Cailian Chen, Kai Chen, Xinyi Le

NeurIPSW 2024 GTA: A Benchmark for General Tool Agents Jize Wang, Ma Zerun, Yining Li, Songyang Zhang, Cailian Chen, Kai Chen, Xinyi Le

ICLR 2024 Gaining Wisdom from Setbacks: Aligning Large Language Models via Mistake Analysis Kai Chen, Chunwei Wang, Kuo Yang, Jianhua Han, Lanqing Hong, Fei Mi, Hang Xu, Zhengying Liu, Wenyong Huang, Zhenguo Li, Dit-Yan Yeung, Lifeng Shang

ICLR 2024 GeoDiffusion: Text-Prompted Geometric Control for Object Detection Data Generation Kai Chen, Enze Xie, Zhe Chen, Yibo Wang, Lanqing Hong, Zhenguo Li, Dit-Yan Yeung

ICLRW 2024 How Susceptible Are Large Language Models to Ideological Manipulation? Kai Chen, Zihao He, Jun Yan, Taiwei Shi, Kristina Lerman

NeurIPS 2024 HumanVid: Demystifying Training Data for Camera-Controllable Human Image Animation Zhenzhi Wang, Yixuan Li, Yanhong Zeng, Youqing Fang, Yuwei Guo, Wenran Liu, Jing Tan, Kai Chen, Tianfan Xue, Bo Dai, Dahua Lin

ECCV 2024 Implicit Concept Removal of Diffusion Models Zhili Liu, Kai Chen, Yifan Zhang, Jianhua Han, Lanqing Hong, Hang Xu, Zhenguo Li, Dit-Yan Yeung, James Kwok

NeurIPS 2024 InternLM-XComposer2-4KHD: A Pioneering Large Vision-Language Model Handling Resolutions from 336 Pixels to 4k HD Xiaoyi Dong, Pan Zhang, Yuhang Zang, Yuhang Cao, Bin Wang, Linke Ouyang, Songyang Zhang, Haodong Duan, Wenwei Zhang, Yining Li, Hang Yan, Yang Gao, Zhe Chen, Xinyue Zhang, Wei Li, Jingwen Li, Wenhai Wang, Kai Chen, Conghui He, Xingcheng Zhang, Jifeng Dai, Yu Qiao, Dahua Lin, Jiaqi Wang

NeurIPS 2024 Lean Workbook: A Large-Scale Lean Problem Set Formalized from Natural Language Math Problems Huaiyuan Ying, Zijian Wu, Yihan Geng, Jiayu Wang, Dahua Lin, Kai Chen

CVPRW 2024 MIPI 2024 Challenge on Few-Shot RAW Image Denoising: Methods and Results Xin Jin, Chunle Guo, Xiaoming Li, Zongsheng Yue, Chongyi Li, Shangchen Zhou, Ruicheng Feng, Yuekun Dai, Peiqing Yang, Chen Change Loy, Ruoqi Li, Chang Liu, Ziyi Wang, Yao Du, Jingjing Yang, Long Bao, Heng Sun, Xiangyu Kong, Xiaoxia Xing, Jinlong Wu, Yuanyang Xue, Hyunhee Park, Sejun Song, Changho Kim, Jingfan Tan, Wenhan Luo, Zikun Liu, Mingde Qiao, Junjun Jiang, Kui Jiang, Yao Xiao, Chuyang Sun, Jinhui Hu, Weijian Ruan, Yubo Dong, Kai Chen, Hyejeong Jo, Jiahao Qin, Bingjie Han, Pinle Qin, Rui Chai, Pengyuan Wang

ECCV 2024 MMBENCH: Is Your Multi-Modal Model an All-Around Player? Yuan Liu, Haodong Duan, Yuanhan Zhang, Bo Li, Songyang Zhang, Wangbo Zhao, Yike Yuan, Jiaqi Wang, Conghui He, Ziwei Liu, Kai Chen, Dahua Lin

NeurIPS 2024 MMBench-Video: A Long-Form Multi-Shot Benchmark for Holistic Video Understanding Xinyu Fang, Kangrui Mao, Haodong Duan, Xiangyu Zhao, Yining Li, Dahua Lin, Kai Chen

ICLR 2024 MagicDrive: Street View Generation with Diverse 3D Geometry Control Ruiyuan Gao, Kai Chen, Enze Xie, Lanqing Hong, Zhenguo Li, Dit-Yan Yeung, Qiang Xu

CVPR 2024 Make-It-Vivid: Dressing Your Animatable Biped Cartoon Characters from Text Junshu Tang, Yanhong Zeng, Ke Fan, Xuheng Wang, Bo Dai, Kai Chen, Lizhuang Ma

NeurIPS 2024 MotionBooth: Motion-Aware Customized Text-to-Video Generation Jianzong Wu, Xiangtai Li, Yanhong Zeng, Jiangning Zhang, Qianyu Zhou, Yining Li, Kai Chen, Yunhai Tong

CVPR 2024 OMG-Seg: Is One Model Good Enough for All Segmentation? Xiangtai Li, Haobo Yuan, Wei Li, Henghui Ding, Size Wu, Wenwei Zhang, Yining Li, Kai Chen, Chen Change Loy

ECCV 2024 Open-Vocabulary SAM: Segment and Recognize Twenty-Thousand Classes Interactively Haobo Yuan, Xiangtai Li, Chong Zhou, Yining Li, Kai Chen, Chen Change Loy

CVPR 2024 PIA: Your Personalized Image Animator via Plug-and-Play Modules in Text-to-Image Models Yiming Zhang, Zhening Xing, Yanhong Zeng, Youqing Fang, Kai Chen

TMLR 2024 PixMIM: Rethinking Pixel Reconstruction in Masked Image Modeling Yuan Liu, Songyang Zhang, Jiacheng Chen, Kai Chen, Dahua Lin

NeurIPS 2024 Prism: A Framework for Decoupling and Assessing the Capabilities of VLMs Yuxuan Qiao, Haodong Duan, Xinyu Fang, Junming Yang, Lin Chen, Songyang Zhang, Jiaqi Wang, Dahua Lin, Kai Chen

CVPR 2024 RTMO: Towards High-Performance One-Stage Real-Time Multi-Person Pose Estimation Peng Lu, Tao Jiang, Yining Li, Xiangtai Li, Kai Chen, Wenming Yang

ECCV 2024 Reliable and Efficient Concept Erasure of Text-to-Image Diffusion Models Chao Gong, Kai Chen, Zhipeng Wei, Jingjing Chen, Yu-Gang Jiang

AAAI 2024 STAIR: Spatial-Temporal Reasoning with Auditable Intermediate Results for Video Question Answering Yueqian Wang, Yuxuan Wang, Kai Chen, Dongyan Zhao

ICLRW 2024 Safer-Instruct: Aligning Language Models with Automated Preference Data Taiwei Shi, Kai Chen, Jieyu Zhao

ECCV 2024 ScanReason: Empowering 3D Visual Grounding with Reasoning Capabilities Chenming Zhu, Tai Wang, Wenwei Zhang, Kai Chen, Xihui Liu

ECCV 2024 Shape-Guided Configuration-Aware Learning for Endoscopic-Image-Based Pose Estimation of Flexible Robotic Instruments Yiyao Ma, Kai Chen, Hon-Sing Tong, Ruofeng Wei, Yui-Lun Ng, Ka-Wai Kwok, Qi Dou

NeurIPS 2024 Shopping MMLU: A Massive Multi-Task Online Shopping Benchmark for Large Language Models Yilun Jin, Zheng Li, Chenwei Zhang, Tianyu Cao, Yifan Gao, Pratik Jayarao, Mao Li, Xin Liu, Ritesh Sarkhel, Xianfeng Tang, Haodong Wang, Zhengyang Wang, Wenju Xu, Jingfeng Yang, Qingyu Yin, Xian Li, Priyanka Nigam, Yi Xu, Kai Chen, Qiang Yang, Meng Jiang, Bing Yin

IJCAI 2024 Temporal Knowledge Graph Extrapolation via Causal Subhistory Identification Kai Chen, Ye Wang, Xin Song, Siwei Chen, Han Yu, Aiping Li

CVPR 2024 Towards Language-Driven Video Inpainting via Multimodal Large Language Models Jianzong Wu, Xiangtai Li, Chenyang Si, Shangchen Zhou, Jingkang Yang, Jiangning Zhang, Yining Li, Kai Chen, Yunhai Tong, Ziwei Liu, Chen Change Loy

AAAI 2024 UMA: Facilitating Backdoor Scanning via Unlearning-Based Model Ablation Yue Zhao, Congyi Li, Kai Chen

CVPR 2024 UVEB: A Large-Scale Benchmark and Baseline Towards Real-World Underwater Video Enhancement Yaofeng Xie, Lingwei Kong, Kai Chen, Ziqiang Zheng, Xiao Yu, Zhibin Yu, Bing Zheng

NeurIPS 2024 Vision Foundation Model Enables Generalizable Object Pose Estimation Kai Chen, Yiyao Ma, Xingyu Lin, Stephen James, Jianshu Zhou, Yun-Hui Liu, Pieter Abbeel, Qi Dou

NeurIPS 2024 YOLOv10: Real-Time End-to-End Object Detection Ao Wang, Hui Chen, Lihao Liu, Kai Chen, Zijia Lin, Jungong Han, Guiguang Ding

ICLRW 2023 Benchmarking 3D Perception Robustness to Common Corruptions and Sensor Failure Lingdong Kong, Youquan Liu, Xin Li, Runnan Chen, Wenwei Zhang, Jiawei Ren, Liang Pan, Kai Chen, Ziwei Liu

ICLRW 2023 Benchmarking Bird's Eye View Detection Robustness to Real-World Corruptions Shaoyuan Xie, Lingdong Kong, Wenwei Zhang, Jiawei Ren, Liang Pan, Kai Chen, Ziwei Liu

AAAI 2023 Boosting Point Clouds Rendering via Radiance Mapping Xiaoyang Huang, Yi Zhang, Bingbing Ni, Teng Li, Kai Chen, Wenjun Zhang

CVPR 2023 Consistent-Teacher: Towards Reducing Inconsistent Pseudo-Targets in Semi-Supervised Object Detection Xinjiang Wang, Xingyi Yang, Shilong Zhang, Yijiang Li, Litong Feng, Shijie Fang, Chengqi Lyu, Kai Chen, Wayne Zhang

ICCV 2023 Deep Fusion Transformer Network with Weighted Vector-Wise Keypoints Voting for Robust 6d Object Pose Estimation Jun Zhou, Kai Chen, Linlin Xu, Qi Dou, Jing Qin

CVPR 2023 Dense Distinct Query for End-to-End Object Detection Shilong Zhang, Xinjiang Wang, Jiaqi Wang, Jiangmiao Pang, Chengqi Lyu, Wenwei Zhang, Ping Luo, Kai Chen

IJCAI 2023 Globally Consistent Federated Graph Autoencoder for Non-IID Graphs Kun Guo, Yutong Fang, Qingqing Huang, Yuting Liang, Ziyao Zhang, Wenyu He, Liu Yang, Kai Chen, Ximeng Liu, Wenzhong Guo

NeurIPS 2023 GlyphControl: Glyph Conditional Control for Visual Text Generation Yukang Yang, Dongnan Gui, Yuhui Yuan, Weicong Liang, Haisong Ding, Han Hu, Kai Chen

ICCV 2023 Improving Pixel-Based MIM by Reducing Wasted Modeling Capability Yuan Liu, Songyang Zhang, Jiacheng Chen, Zhaohui Yu, Kai Chen, Dahua Lin

ICCV 2023 Learning Shape Primitives via Implicit Convexity Regularization Xiaoyang Huang, Yi Zhang, Kai Chen, Teng Li, Wenjun Zhang, Bingbing Ni

CVPR 2023 Mixed Autoencoder for Self-Supervised Visual Representation Learning Kai Chen, Zhili Liu, Lanqing Hong, Hang Xu, Zhenguo Li, Dit-Yan Yeung

CVPR 2023 RIFormer: Keep Your Vision Backbone Effective but Removing Token Mixer Jiahao Wang, Songyang Zhang, Yong Liu, Taiqiang Wu, Yujiu Yang, Xihui Liu, Kai Chen, Ping Luo, Dahua Lin

ICCV 2023 Robo3D: Towards Robust and Reliable 3D Perception Against Corruptions Lingdong Kong, Youquan Liu, Xin Li, Runnan Chen, Wenwei Zhang, Jiawei Ren, Liang Pan, Kai Chen, Ziwei Liu

NeurIPS 2023 Segment Any Point Cloud Sequences by Distilling Vision Foundation Models Youquan Liu, Lingdong Kong, Jun Cen, Runnan Chen, Wenwei Zhang, Liang Pan, Kai Chen, Ziwei Liu

AAAI 2023 Semantics-Aware Dynamic Localization and Refinement for Referring Image Segmentation Zhao Yang, Jiaqi Wang, Yansong Tang, Kai Chen, Hengshuang Zhao, Philip H. S. Torr

IJCAI 2023 TG-VQA: Ternary Game of Video Question Answering Hao Li, Peng Jin, Zesen Cheng, Songyang Zhang, Kai Chen, Zhennan Wang, Chang Liu, Jie Chen

ICLR 2023 Task-Customized Masked Autoencoder via Mixture of Cluster-Conditional Experts Zhili Liu, Kai Chen, Jianhua Han, Lanqing Hong, Hang Xu, Zhenguo Li, James Kwok

ICCV 2023 UMC: A Unified Bandwidth-Efficient and Multi-Resolution Based Collaborative Perception Framework Tianhang Wang, Guang Chen, Kai Chen, Zhengfa Liu, Bo Zhang, Alois Knoll, Changjun Jiang

AAAI 2022 Attacking Video Recognition Models with Bullet-Screen Comments Kai Chen, Zhipeng Wei, Jingjing Chen, Zuxuan Wu, Yu-Gang Jiang

ECCV 2022 CODA: A Real-World Road Corner Case Dataset for Object Detection in Autonomous Driving Kaican Li, Kai Chen, Haoyu Wang, Lanqing Hong, Chaoqiang Ye, Jianhua Han, Yukuai Chen, Wei Zhang, Chunjing Xu, Dit-Yan Yeung, Xiaodan Liang, Zhenguo Li, Hang Xu

NeurIPS 2022 Deliberated Domain Bridging for Domain Adaptive Semantic Segmentation Lin Chen, Zhixiang Wei, Xin Jin, Huaian Chen, Miao Zheng, Kai Chen, Yi Jin

ECCV 2022 Dense Siamese Network for Dense Unsupervised Learning Wenwei Zhang, Jiangmiao Pang, Kai Chen, Chen Change Loy

CVPR 2022 GCFSR: A Generative and Controllable Face Super Resolution Method Without Facial and GAN Priors Jingwen He, Wu Shi, Kai Chen, Lean Fu, Chao Dong

CVPR 2022 Group R-CNN for Weakly Semi-Supervised Object Detection with Points Shilong Zhang, Zhuoran Yu, Liyang Liu, Xinjiang Wang, Aojun Zhou, Kai Chen

CVPR 2022 LAVT: Language-Aware Vision Transformer for Referring Image Segmentation Zhao Yang, Jiaqi Wang, Yansong Tang, Kai Chen, Hengshuang Zhao, Philip H.S. Torr

ECCVW 2022 Mitigating Representation Bias in Action Recognition: Algorithms and Benchmarks Haodong Duan, Yue Zhao, Kai Chen, Yuanjun Xiong, Dahua Lin

CVPRW 2022 NTIRE 2022 Challenge on Super-Resolution and Quality Enhancement of Compressed Video: Dataset, Methods and Results Ren Yang, Radu Timofte, Meisong Zheng, Qunliang Xing, Minglang Qiao, Mai Xu, Lai Jiang, Huaida Liu, Ying Chen, Youcheng Ben, Xiao Zhou, Chen Fu, Pei Cheng, Gang Yu, Junyi Li, Renlong Wu, Zhilu Zhang, Wei Shang, Zhengyao Lv, Yunjin Chen, Mingcai Zhou, Dongwei Ren, Kai Zhang, Wangmeng Zuo, Pavel Ostyakov, Dmitry Vyal, Shakarim Soltanayev, Chervontsev Sergey, Magauiya Zhussip, Xueyi Zou, Youliang Yan, Pablo Navarrete Michelini, Yunhua Lu, Diankai Zhang, Shaoli Liu, Si Gao, Biao Wu, Chengjian Zheng, Xiaofeng Zhang, Kaidi Lu, Ning Wang, Thuong Nguyen Canh, Thong Bach, Qing Wang, Xiaopeng Sun, Haoyu Ma, Shijie Zhao, Junlin Li, Liangbin Xie, Shuwei Shi, Yujiu Yang, Xintao Wang, Jinjin Gu, Chao Dong, Xiaodi Shi, Chunmei Nian, Dong Jiang, Jucai Lin, Zhihuai Xie, Mao Ye, Dengyan Luo, Liuhan Peng, Shengjie Chen, Xin Liu, Qian Wang, Boyang Liang, Hang Dong, Yuhao Huang, Kai Chen, Xingbei Guo, Yujing Sun, Huilei Wu, Pengxu Wei, Yulin Huang, Junying Chen, Ik Hyun Lee, Sunder Ali Khowaja, Jiseok Yoon

CVPR 2022 OCSampler: Compressing Videos to One CLIP with Single-Step Sampling Jintao Lin, Haodong Duan, Kai Chen, Dahua Lin, Limin Wang

CVPR 2022 Revisiting Skeleton-Based Action Recognition Haodong Duan, Yue Zhao, Kai Chen, Dahua Lin, Bo Dai

ECCV 2022 Sim-to-Real 6d Object Pose Estimation via Iterative Self-Training for Robotic Bin Picking Kai Chen, Rui Cao, Stephen James, Yichuan Li, Yun-Hui Liu, Pieter Abbeel, Qi Dou

AAAI 2022 Task-Customized Self-Supervised Pre-Training with Scalable Dynamic Routing Zhili Liu, Jianhua Han, Lanqing Hong, Hang Xu, Kai Chen, Chunjing Xu, Zhenguo Li

CVPR 2022 TransRank: Self-Supervised Video Representation Learning via Ranking-Based Transformation Recognition Haodong Duan, Nanxuan Zhao, Kai Chen, Dahua Lin

CVPR 2022 Video K-Net: A Simple, Strong, and Unified Baseline for Video Segmentation Xiangtai Li, Wenwei Zhang, Jiangmiao Pang, Kai Chen, Guangliang Cheng, Yunhai Tong, Chen Change Loy

NeurIPS 2021 Few-Shot Object Detection via Association and DIscrimination Yuhang Cao, Jiaqi Wang, Ying Jin, Tong Wu, Kai Chen, Ziwei Liu, Dahua Lin

MLJ 2021 Gaussian Processes with Skewed Laplace Spectral Mixture Kernels for Long-Term Forecasting Kai Chen, Twan van Laarhoven, Elena Marchiori

NeurIPS 2021 K-Net: Towards Unified Image Segmentation Wenwei Zhang, Jiangmiao Pang, Kai Chen, Chen Change Loy

ICCV 2021 Learning Icosahedral Spherical Probability mAP Based on Bingham Mixture Model for Vanishing Point Estimation Haoang Li, Kai Chen, Pyojin Kim, Kuk-Jin Yoon, Zhe Liu, Kyungdon Joo, Yun-Hui Liu

CVPR 2021 Learning to Identify Correct 2D-2D Line Correspondences on Sphere Haoang Li, Kai Chen, Ji Zhao, Jiangliu Wang, Pyojin Kim, Zhe Liu, Yun-Hui Liu

ICCV 2021 MultiSiam: Self-Supervised Multi-Instance Siamese Representation Learning for Autonomous Driving Kai Chen, Lanqing Hong, Hang Xu, Zhenguo Li, Dit-Yan Yeung

CVPR 2021 Positional Encoding as Spatial Inductive Bias in GANs Rui Xu, Xintao Wang, Kai Chen, Bolei Zhou, Chen Change Loy

ICCV 2021 SGPA: Structure-Guided Prior Adaptation for Category-Level 6d Object Pose Estimation Kai Chen, Qi Dou

CVPR 2021 Seesaw Loss for Long-Tailed Instance Segmentation Jiaqi Wang, Wenwei Zhang, Yuhang Zang, Yuhang Cao, Jiangmiao Pang, Tao Gong, Kai Chen, Ziwei Liu, Chen Change Loy, Dahua Lin

AAAI 2021 Temporal ROI Align for Video Object Recognition Tao Gong, Kai Chen, Xinjiang Wang, Qi Chu, Feng Zhu, Dahua Lin, Nenghai Yu, Huamin Feng

CVPRW 2021 VRHI: Visibility Restoration for Hazy Images Using a Haze Density Model Mingye Ju, Chuheng Chen, Juping Liu, Kai Chen, Dengyin Zhang

AAAI 2020 Real-Time Scene Text Detection with Differentiable Binarization Minghui Liao, Zhaoyi Wan, Cong Yao, Kai Chen, Xiang Bai

ECCV 2020 Side-Aware Boundary Localization for More Precise Object Detection Jiaqi Wang, Wenwei Zhang, Yuhang Cao, Kai Chen, Jiangmiao Pang, Tao Gong, Jianping Shi, Chen Change Loy, Dahua Lin

ECML-PKDD 2019 Incorporating Dependencies in Spectral Kernels for Gaussian Processes Kai Chen, Twan van Laarhoven, Jinsong Chen, Elena Marchiori

ICLR 2018 QANet: Combining Local Convolution with Global Self-Attention for Reading Comprehension Adams Wei Yu, David Dohan, Minh-Thang Luong, Rui Zhao, Kai Chen, Mohammad Norouzi, Quoc V. Le

CVPR 2017 Discover and Learn New Objects from Documentaries Kai Chen, Hang Song, Chen Change Loy, Dahua Lin

ICCVW 2017 The Visual Object Tracking VOT2017 Challenge Results Matej Kristan, Ales Leonardis, Jiri Matas, Michael Felsberg, Roman P. Pflugfelder, Luka Cehovin Zajc, Tomas Vojir, Gustav Häger, Alan Lukezic, Abdelrahman Eldesokey, Gustavo Fernández, Álvaro García-Martín, Andrej Muhic, Alfredo Petrosino, Alireza Memarmoghadam, Andrea Vedaldi, Antoine Manzanera, Antoine Tran, A. Aydin Alatan, Bogdan Mocanu, Boyu Chen, Chang Huang, Changsheng Xu, Chong Sun, Dalong Du, David Zhang, Dawei Du, Deepak Mishra, Erhan Gundogdu, Erik Velasco-Salido, Fahad Shahbaz Khan, Francesco Battistone, Gorthi R. K. Sai Subrahmanyam, Goutam Bhat, Guan Huang, Guilherme Sousa Bastos, Guna Seetharaman, Hongliang Zhang, Houqiang Li, Huchuan Lu, Isabela Drummond, Jack Valmadre, Jae-chan Jeong, Jaeil Cho, Jae-Yeong Lee, Jana Noskova, Jianke Zhu, Jin Gao, Jingyu Liu, Ji-Wan Kim, João F. Henriques, José M. Martínez, Junfei Zhuang, Junliang Xing, Junyu Gao, Kai Chen, Kannappan Palaniappan, Karel Lebeda, Ke Gao, Kris M. Kitani, Lei Zhang, Lijun Wang, Lingxiao Yang, Longyin Wen, Luca Bertinetto, Mahdieh Poostchi, Martin Danelljan, Matthias Mueller, Mengdan Zhang, Ming-Hsuan Yang, Nianhao Xie, Ning Wang, Ondrej Miksik, Payman Moallem, Pallavi M. Venugopal, Pedro Senna, Philip H. S. Torr, Qiang Wang, Qifeng Yu, Qingming Huang, Rafael Martin Nieto, Richard Bowden, Risheng Liu, Ruxandra Tapu, Simon Hadfield, Siwei Lyu, Stuart Golodetz, Sunglok Choi, Tianzhu Zhang, Titus Zaharia, Vincenzo Santopietro, Wei Zou, Weiming Hu, Wenbing Tao, Wenbo Li, Wengang Zhou, Xianguo Yu, Xiao Bian, Yang Li, Yifan Xing, Yingruo Fan, Zheng Zhu, Zhipeng Zhang, Zhiqun He

IJCAI 2016 Planning with Task-Oriented Knowledge Acquisition for a Service Robot Kai Chen, Fangkai Yang, Xiaoping Chen

NeurIPS 2013 Distributed Representations of Words and Phrases and Their Compositionality Tomas Mikolov, Ilya Sutskever, Kai Chen, Greg S Corrado, Jeff Dean

ICLR 2013 Efficient Estimation of Word Representations in Vector Space Tomás Mikolov, Kai Chen, Greg Corrado, Jeffrey Dean

Notable Works 2013 Efficient Estimation of Word Representations in Vector Space Tomas Mikolov, Kai Chen, Greg Corrado, Jeffrey Dean

ICML 2012 Building High-Level Features Using Large Scale Unsupervised Learning Quoc V. Le, Marc'Aurelio Ranzato, Rajat Monga, Matthieu Devin, Greg Corrado, Kai Chen, Jeffrey Dean, Andrew Y. Ng

NeurIPS 2012 Large Scale Distributed Deep Networks Jeffrey Dean, Greg Corrado, Rajat Monga, Kai Chen, Matthieu Devin, Mark Mao, Marc'aurelio Ranzato, Andrew Senior, Paul Tucker, Ke Yang, Quoc V. Le, Andrew Y. Ng