Chen, Zhe

50 publications

AAAI 2025 ChemVLM: Exploring the Power of Multimodal Large Language Models in Chemistry Area Junxian Li, Di Zhang, Xunzhi Wang, Zeying Hao, Jingdi Lei, Qian Tan, Cai Zhou, Wei Liu, Yaotian Yang, Xinrui Xiong, Weiyun Wang, Zhe Chen, Wenhai Wang, Wei Li, Mao Su, Shufei Zhang, Wanli Ouyang, Yuqiang Li, Dongzhan Zhou

AAAI 2025 Concurrent Planning and Execution in Lifelong Multi-Agent Path Finding with Delay Probabilities Yue Zhang, Zhe Chen, Daniel Harabor, Pierre Le Bodic, Peter J. Stuckey

CVPR 2025 Docopilot: Improving Multimodal Models for Document-Level Understanding Yuchen Duan, Zhe Chen, Yusong Hu, Weiyun Wang, Shenglong Ye, Botian Shi, Lewei Lu, Qibin Hou, Tong Lu, Hongsheng Li, Jifeng Dai, Wenhai Wang

CVPR 2025 HoVLE: Unleashing the Power of Monolithic Vision-Language Models with Holistic Vision-Language Embedding Chenxin Tao, Shiqian Su, Xizhou Zhu, Chenyu Zhang, Zhe Chen, Jiawen Liu, Wenhai Wang, Lewei Lu, Gao Huang, Yu Qiao, Jifeng Dai

AAAI 2025 Incomplete Modality Disentangled Representation for Ophthalmic Disease Grading and Diagnosis Chengzhi Liu, Zile Huang, Zhe Chen, Feilong Tang, Yu Tian, Zhongxing Xu, Zihong Luo, Yalin Zheng, Yanda Meng

ICLR 2025 OmniCorpus: A Unified Multimodal Corpus of 10 Billion-Level Images Interleaved with Text Qingyun Li, Zhe Chen, Weiyun Wang, Wenhai Wang, Shenglong Ye, Zhenjiang Jin, Guanzhou Chen, Yinan He, Zhangwei Gao, Erfei Cui, Jiashuo Yu, Hao Tian, Jiasheng Zhou, Chao Xu, Bin Wang, Xingjian Wei, Wei Li, Wenjian Zhang, Bo Zhang, Pinlong Cai, Licheng Wen, Xiangchao Yan, Pei Chu, Yi Wang, Min Dou, Changyao Tian, Xizhou Zhu, Lewei Lu, Yushi Chen, Junjun He, Tong Lu, Yali Wang, Limin Wang, Dahua Lin, Yu Qiao, Botian Shi, Conghui He, Jifeng Dai

NeurIPS 2025 On Geometry-Enhanced Parameter-Efficient Fine-Tuning for 3D Scene Segmentation Liyao Tang, Zhe Chen, Dacheng Tao

AAAI 2025 Online Guidance Graph Optimization for Lifelong Multi-Agent Path Finding Hongzhi Zang, Yulun Zhang, He Jiang, Zhe Chen, Daniel Harabor, Peter J. Stuckey, Jiaoyang Li

CVPR 2025 PVC: Progressive Visual Token Compression for Unified Image and Video Processing in Large Vision-Language Models Chenyu Yang, Xuan Dong, Xizhou Zhu, Weijie Su, Jiahao Wang, Hao Tian, Zhe Chen, Wenhai Wang, Lewei Lu, Jifeng Dai

JAIR 2025 Prioritised Planning: Completeness, Optimality, and Complexity Jonathan Morag, Yue Zhang, Daniel Koyfman, Zhe Chen, Ariel Felner, Daniel Harabor, Roni Stern

NeurIPS 2025 RAD: Towards Trustworthy Retrieval-Augmented Multi-Modal Clinical Diagnosis Haolin Li, Tianjie Dai, Zhe Chen, Siyuan Du, Jiangchao Yao, Ya Zhang, Yanfeng Wang

AAAI 2025 ReactGPT: Understanding of Chemical Reactions via In-Context Tuning Zhe Chen, Zhe Fang, Wenhao Tian, Zhaoguang Long, Changzhi Sun, Yuefeng Chen, Hao Yuan, Honglin Li, Man Lan

IJCAI 2025 RotateKV: Accurate and Robust 2-Bit KV Cache Quantization for LLMs via Outlier-Aware Adaptive Rotations Zunhai Su, Hanyu Wei, Zhe Chen, Wang Shen, Linge Li, Huangqi Yu, Kehong Yuan

ICCV 2025 SHeaP: Self-Supervised Head Geometry Predictor Learned via 2D Gaussians Liam Schoneveld, Zhe Chen, Davide Davoli, Jiapeng Tang, Saimon Terazawa, Ko Nishino, Matthias Nießner

AAAI 2025 Toward Modality Gap: Vision Prototype Learning for Weakly-Supervised Semantic Segmentation with CLIP Zhongxing Xu, Feilong Tang, Zhe Chen, Yingxue Su, Zhiyi Zhao, Ge Zhang, Jionglong Su, Zongyuan Ge

ICLR 2025 Vision-RWKV: Efficient and Scalable Visual Perception with RWKV-like Architectures Yuchen Duan, Weiyun Wang, Zhe Chen, Xizhou Zhu, Lewei Lu, Tong Lu, Yu Qiao, Hongsheng Li, Jifeng Dai, Wenhai Wang

AAAI 2024 AVSegFormer: Audio-Visual Segmentation with Transformer Shengyi Gao, Zhe Chen, Guo Chen, Wenhai Wang, Tong Lu

ICLR 2024 Bounding Box Stability Against Feature Dropout Reflects Detector Generalization Across Environments Yang Yang, Wenhai Wang, Zhe Chen, Jifeng Dai, Liang Zheng

ICLR 2024 GeoDiffusion: Text-Prompted Geometric Control for Object Detection Data Generation Kai Chen, Enze Xie, Zhe Chen, Yibo Wang, Lanqing Hong, Zhenguo Li, Dit-Yan Yeung

NeurIPS 2024 InternLM-XComposer2-4KHD: A Pioneering Large Vision-Language Model Handling Resolutions from 336 Pixels to 4k HD Xiaoyi Dong, Pan Zhang, Yuhang Zang, Yuhang Cao, Bin Wang, Linke Ouyang, Songyang Zhang, Haodong Duan, Wenwei Zhang, Yining Li, Hang Yan, Yang Gao, Zhe Chen, Xinyue Zhang, Wei Li, Jingwen Li, Wenhai Wang, Kai Chen, Conghui He, Xingcheng Zhang, Jifeng Dai, Yu Qiao, Dahua Lin, Jiaqi Wang

CVPR 2024 InternVL: Scaling up Vision Foundation Models and Aligning for Generic Visual-Linguistic Tasks Zhe Chen, Jiannan Wu, Wenhai Wang, Weijie Su, Guo Chen, Sen Xing, Muyan Zhong, Qinglong Zhang, Xizhou Zhu, Lewei Lu, Bin Li, Ping Luo, Tong Lu, Yu Qiao, Jifeng Dai

MLJ 2024 Kalt: Generating Adversarial Explainable Chinese Legal Texts Yunting Zhang, Shang Li, Lin Ye, Hongli Zhang, Zhe Chen, Binxing Fang

NeurIPS 2024 Needle in a Multimodal Haystack Weiyun Wang, Shuibo Zhang, Yiming Ren, Yuchen Duan, Tiantong Li, Shuo Liu, Mengkang Hu, Zhe Chen, Kaipeng Zhang, Lewei Lu, Xizhou Zhu, Ping Luo, Yu Qiao, Jifeng Dai, Wenqi Shao, Wenhai Wang

AAAI 2024 SimDistill: Simulated Multi-Modal Distillation for BEV 3D Object Detection Haimei Zhao, Qiming Zhang, Shanshan Zhao, Zhe Chen, Jing Zhang, Dacheng Tao

AAAI 2024 Structural Information Guided Multimodal Pre-Training for Vehicle-Centric Perception Xiao Wang, Wentao Wu, Chenglong Li, Zhicheng Zhao, Zhe Chen, Yukai Shi, Jin Tang

ECCV 2024 The All-Seeing Project V2: Towards General Relation Comprehension of the Open World Weiyun Wang, Yiming Ren, Haowen Luo, Tiantong Li, Chenxiang Yan, Zhe Chen, Wenhai Wang, Qingyun Li, Lewei Lu, Xizhou Zhu, Yu Qiao, Jifeng Dai

ICLR 2024 The All-Seeing Project: Towards Panoptic Visual Recognition and Understanding of the Open World Weiyun Wang, Min Shi, Qingyun Li, Wenhai Wang, Zhenhang Huang, Linjie Xing, Zhe Chen, Hao Li, Xizhou Zhu, Zhiguo Cao, Yushi Chen, Tong Lu, Jifeng Dai, Yu Qiao

AAAI 2024 Traffic Flow Optimisation for Lifelong Multi-Agent Path Finding Zhe Chen, Daniel Harabor, Jiaoyang Li, Peter J. Stuckey

NeurIPS 2024 VisionLLM V2: An End-to-End Generalist Multimodal Large Language Model for Hundreds of Vision-Language Tasks Jiannan Wu, Muyan Zhong, Sen Xing, Zeqiang Lai, Zhaoyang Liu, Zhe Chen, Wenhai Wang, Xizhou Zhu, Lewei Lu, Tong Lu, Ping Luo, Yu Qiao, Jifeng Dai

NeurIPS 2023 All Points Matter: Entropy-Regularized Distribution Alignment for Weakly-Supervised 3D Segmentation Liyao Tang, Zhe Chen, Shanshan Zhao, Chaoyue Wang, Dacheng Tao

CVPR 2023 CLAMP: Prompt-Based Contrastive Learning for Connecting Language and Animal Pose Xu Zhang, Wen Wang, Zhe Chen, Yufei Xu, Jing Zhang, Dacheng Tao

ICCV 2023 DDP: Diffusion Model for Dense Visual Prediction Yuanfeng Ji, Zhe Chen, Enze Xie, Lanqing Hong, Xihui Liu, Zhaoqiang Liu, Tong Lu, Zhenguo Li, Ping Luo

IJCAI 2023 Graph Propagation Transformer for Graph Representation Learning Zhe Chen, Hao Tan, Tao Wang, Tianrun Shen, Tong Lu, Qiuying Peng, Cheng Cheng, Yue Qi

CVPR 2023 InternImage: Exploring Large-Scale Vision Foundation Models with Deformable Convolutions Wenhai Wang, Jifeng Dai, Zhe Chen, Zhenhang Huang, Zhiqi Li, Xizhou Zhu, Xiaowei Hu, Tong Lu, Lewei Lu, Hongsheng Li, Xiaogang Wang, Yu Qiao

ICCV 2023 OCHID-Fi: Occlusion-Robust Hand Pose Estimation in 3D via RF-Vision Shujie Zhang, Tianyue Zheng, Zhe Chen, Jingzhi Hu, Abdelwahed Khamis, Jiajun Liu, Jun Luo

CVPR 2023 Pose-Disentangled Contrastive Learning for Self-Supervised Facial Representation Yuanyuan Liu, Wenbin Wang, Yibing Zhan, Shaoze Feng, Kejun Liu, Zhe Chen

ICLR 2023 Vision Transformer Adapter for Dense Predictions Zhe Chen, Yuchen Duan, Wenhai Wang, Junjun He, Tong Lu, Jifeng Dai, Yu Qiao

NeurIPS 2023 VisionLLM: Large Language Model Is Also an Open-Ended Decoder for Vision-Centric Tasks Wenhai Wang, Zhe Chen, Xiaokang Chen, Jiannan Wu, Xizhou Zhu, Gang Zeng, Ping Luo, Tong Lu, Jie Zhou, Yu Qiao, Jifeng Dai

CVPR 2022 Contrastive Boundary Learning for Point Cloud Segmentation Liyao Tang, Yibing Zhan, Zhe Chen, Baosheng Yu, Dacheng Tao

AAAI 2022 MAPF-LNS2: Fast Repairing for Multi-Agent Path Finding via Large Neighborhood Search Jiaoyang Li, Zhe Chen, Daniel Harabor, Peter J. Stuckey, Sven Koenig

CVPR 2022 Recurrent Glimpse-Based Decoder for Detection with Transformer Zhe Chen, Jing Zhang, Dacheng Tao

AAAI 2022 SASA: Semantics-Augmented Set Abstraction for Point-Based 3D Object Detection Chen Chen, Zhe Chen, Jing Zhang, Dacheng Tao

AAAI 2022 Towards Ultra-Resolution Neural Style Transfer via Thumbnail Instance Normalization Zhe Chen, Wenhai Wang, Enze Xie, Tong Lu, Ping Luo

IJCAI 2021 Anytime Multi-Agent Path Finding via Large Neighborhood Search Jiaoyang Li, Zhe Chen, Daniel Harabor, Peter J. Stuckey, Sven Koenig

AAAI 2021 Symmetry Breaking for K-Robust Multi-Agent Path Finding Zhe Chen, Daniel Damir Harabor, Jiaoyang Li, Peter J. Stuckey

ECCV 2020 Invertible Neural BRDF for Object Inverse Rendering Zhe Chen, Shohei Nobuhara, Ko Nishino

IJCAI 2020 TextFuseNet: Scene Text Detection with Richer Fused Features Jian Ye, Zhe Chen, Juhua Liu, Bo Du

ECCV 2018 Context Refinement for Object Detection Zhe Chen, Shaoli Huang, Dacheng Tao

CVPR 2015 MUlti-Store Tracker (MUSTer): A Cognitive Psychology Inspired Approach to Object Tracking Zhibin Hong, Zhe Chen, Chaohui Wang, Xue Mei, Danil Prokhorov, Dacheng Tao

NeCo 2002 On Different Facets of Regularization Theory Zhe Chen, Simon Haykin