Jie, Zequn

33 publications

ICCV 2025 CLIP-GS: Unifying Vision-Language Representation with 3D Gaussian Splatting Siyu Jiao, Haoye Dong, Yuyang Yin, Zequn Jie, Yinlong Qian, Yao Zhao, Humphrey Shi, Yunchao Wei

NeurIPS 2025 FlexVAR: Flexible Visual Autoregressive Modeling Without Residual Prediction Siyu Jiao, Gengwei Zhang, Yinlong Qian, Jiancheng Huang, Yao Zhao, Humphrey Shi, Lin Ma, Yunchao Wei, Zequn Jie

ICCV 2025 RoboTron-Drive: All-in-One Large Multimodal Model for Autonomous Driving Zhijian Huang, Chengjian Feng, Feng Yan, Baihui Xiao, Zequn Jie, Yujie Zhong, Xiaodan Liang, Lin Ma

CVPRW 2025 UniToken: Harmonizing Multimodal Understanding and Generation Through Unified Visual Encoding Yang Jiao, Haibo Qiu, Zequn Jie, Shaoxiang Chen, Jingjing Chen, Lin Ma, Yu-Gang Jiang

ECCV 2024 3D Weakly Supervised Semantic Segmentation with 2D Vision-Language Guidance Xiaoxu Xu, Yitian Yuan, Jinlong Li, Qiudan Zhang, Zequn Jie, Lin Ma, Hao Tang, Nicu Sebe, Xu Wang

CVPR 2024 AlignSAM: Aligning Segment Anything Model to Open Context via Reinforcement Learning Duojun Huang, Xinyu Xiong, Jie Ma, Jichang Li, Zequn Jie, Lin Ma, Guanbin Li

CVPR 2024 InstaGen: Enhancing Object Detection by Training on Synthetic Dataset Chengjian Feng, Yujie Zhong, Zequn Jie, Weidi Xie, Lin Ma

AAAI 2024 Instance-Aware Multi-Camera 3D Object Detection with Structural Priors Mining and Self-Boosting Learning Yang Jiao, Zequn Jie, Shaoxiang Chen, Lechao Cheng, Jingjing Chen, Lin Ma, Yu-Gang Jiang

CVPR 2024 Investigating Compositional Challenges in Vision-Language Models for Visual Grounding Yunan Zeng, Yan Huang, Jinjin Zhang, Zequn Jie, Zhenhua Chai, Liang Wang

NeurIPS 2024 Lumen: Unleashing Versatile Vision-Centric Capabilities of Large Multimodal Models Yang Jiao, Shaoxiang Chen, Zequn Jie, Jingjing Chen, Lin Ma, Yu-Gang Jiang

ECCV 2024 Making Large Language Models Better Planners with Reasoning-Decision Alignment Zhijian Huang, Tao Tang, Shaoxiang Chen, Sihao Lin, Zequn Jie, Lin Ma, Guangrun Wang, Xiaodan Liang

CVPR 2023 AeDet: Azimuth-Invariant Multi-View 3D Object Detection Chengjian Feng, Zequn Jie, Yujie Zhong, Xiangxiang Chu, Lin Ma

AAAI 2023 Curriculum Multi-Negative Augmentation for Debiased Video Grounding Xiaohan Lan, Yitian Yuan, Hong Chen, Xin Wang, Zequn Jie, Lin Ma, Zhi Wang, Wenwu Zhu

CVPR 2023 MSMDFusion: Fusing LiDAR and Camera at Multiple Scales with Multi-Depth Seeds for 3D Object Detection Yang Jiao, Zequn Jie, Shaoxiang Chen, Jingjing Chen, Lin Ma, Yu-Gang Jiang

CVPRW 2023 Multi View Action Recognition for Distracted Driver Behavior Localization Wei Zhou, Yinlong Qian, Zequn Jie, Lin Ma

NeurIPS 2022 Expansion and Shrinkage of Localization for Weakly-Supervised Semantic Segmentation Jinlong Li, Zequn Jie, Xu Wang, Xiaolin Wei, Lin Ma

ECCV 2022 MORE: Multi-Order RElation Mining for Dense Captioning in 3D Scenes Yang Jiao, Shaoxiang Chen, Zequn Jie, Jingjing Chen, Lin Ma, Yu-Gang Jiang

ECCV 2022 PromptDet: Towards Open-Vocabulary Detection Using Uncurated Images Chengjian Feng, Yujie Zhong, Zequn Jie, Xiangxiang Chu, Haibing Ren, Xiaolin Wei, Weidi Xie, Lin Ma

CVPRW 2019 Learning Object-Wise Semantic Representation for Detection in Remote Sensing Imagery Chengzheng Li, Chunyan Xu, Zhen Cui, Dan Wang, Zequn Jie, Tong Zhang, Jian Yang

AAAI 2019 Localizing Natural Language in Videos Jingyuan Chen, Lin Ma, Xinpeng Chen, Zequn Jie, Jiebo Luo

IJCAI 2018 Image-Level to Pixel-Wise Labeling: From Theory to Practice Tiezhu Sun, Wei Zhang, Zhijie Wang, Lin Ma, Zequn Jie

ECCV 2018 Joint Task-Recursive Learning for Semantic Segmentation and Depth Estimation Zhenyu Zhang, Zhen Cui, Chunyan Xu, Zequn Jie, Xiang Li, Jian Yang

ECCV 2018 Modeling Varying Camera-IMU Time Offset in Optimization-Based Visual-Inertial Odometry Yonggen Ling, Linchao Bao, Zequn Jie, Fengming Zhu, Ziyang Li, Shanmin Tang, Yongsheng Liu, Wei Liu, Tong Zhang

ECCV 2018 Modular Generative Adversarial Networks Bo Zhao, Bo Chang, Zequn Jie, Leonid Sigal

ICML 2018 Policy Optimization with Demonstrations Bingyi Kang, Zequn Jie, Jiashi Feng

CVPR 2017 Deep Self-Taught Learning for Weakly Supervised Object Localization Zequn Jie, Yunchao Wei, Xiaojie Jin, Jiashi Feng, Wei Liu

ICCV 2017 FoveaNet: Perspective-Aware Urban Scene Parsing Xin Li, Zequn Jie, Wei Wang, Changsong Liu, Jimei Yang, Xiaohui Shen, Zhe Lin, Qiang Chen, Shuicheng Yan, Jiashi Feng

AAAI 2017 Multi-Path Feedback Recurrent Neural Networks for Scene Parsing Xiaojie Jin, Yunpeng Chen, Zequn Jie, Jiashi Feng, Shuicheng Yan

ICCV 2017 Neural Person Search Machines Hao Liu, Jiashi Feng, Zequn Jie, Karlekar Jayashree, Bo Zhao, Meibin Qi, Jianguo Jiang, Shuicheng Yan

NeurIPS 2017 Predicting Scene Parsing and Motion Dynamics in the Future Xiaojie Jin, Huaxin Xiao, Xiaohui Shen, Jimei Yang, Zhe Lin, Yunpeng Chen, Zequn Jie, Jiashi Feng, Shuicheng Yan

ICCV 2017 Video Scene Parsing with Predictive Feature Learning Xiaojie Jin, Xin Li, Huaxin Xiao, Xiaohui Shen, Zhe Lin, Jimei Yang, Yunpeng Chen, Jian Dong, Luoqi Liu, Zequn Jie, Jiashi Feng, Shuicheng Yan

CVPR 2016 Reversible Recursive Instance-Level Object Segmentation Xiaodan Liang, Yunchao Wei, Xiaohui Shen, Zequn Jie, Jiashi Feng, Liang Lin, Shuicheng Yan

NeurIPS 2016 Tree-Structured Reinforcement Learning for Sequential Object Localization Zequn Jie, Xiaodan Liang, Jiashi Feng, Xiaojie Jin, Wen Lu, Shuicheng Yan