Zhang, Ji

44 publications

CVPR 2025 A Simple yet Effective Layout Token in Large Language Models for Document Understanding Zhaoqing Zhu, Chuwei Luo, Zirui Shao, Feiyu Gao, Hangdi Xing, Qi Zheng, Ji Zhang

CVPR 2025 AdaMMS: Model Merging for Heterogeneous Multimodal Large Language Models with Unsupervised Coefficient Optimization Yiyang Du, Xiaochen Wang, Chi Chen, Jiabo Ye, Yiru Wang, Peng Li, Ming Yan, Ji Zhang, Fei Huang, Zhifang Sui, Maosong Sun, Yang Liu

ICML 2025 EGPlace: An Efficient Macro Placement Method via Evolutionary Search with Greedy Repositioning Guided Mutation Ji Deng, Zhao Li, Ji Zhang, Jun Gao

ICML 2025 Exploiting Presentative Feature Distributions for Parameter-Efficient Continual Learning of Large Language Models Xin Cheng, Jiabo Ye, Haiyang Xu, Ming Yan, Ji Zhang, Feng Liu, Fei Huang, Lei Feng

IJCAI 2025 Filling the Missings: Spatiotemporal Data Imputation by Conditional Diffusion Wenying He, Jieling Huang, Junhua Gu, Ji Zhang, Yude Bai

ICCV 2025 MOSAIC: Generating Consistent, Privacy-Preserving Scenes from Multiple Depth Views in Multi-Room Environments Zhixuan Liu, Haokun Zhu, Rui Chen, Jonathan Francis, Soonmin Hwang, Ji Zhang, Jean Oh

WACV 2025 OccLoff: Learning Optimized Feature Fusion for 3D Occupancy Prediction Ji Zhang, Yiran Ding, Zixin Liu

ICLRW 2025 PC-Agent: A Hierarchical Agentic Framework for Complex Task Automation on PC Haowei Liu, Xi Zhang, Haiyang Xu, Yuyang Wanyan, Junyang Wang, Ming Yan, Ji Zhang, Chunfeng Yuan, Changsheng Xu, Weiming Hu, Fei Huang

ICML 2025 Score as Action: Fine Tuning Diffusion Generative Models by Continuous-Time Reinforcement Learning Hanyang Zhao, Haoxian Chen, Ji Zhang, David Yao, Wenpin Tang

ICLRW 2025 Score as Action: Fine-Tuning Diffusion Generative Models by Continuous-Time Reinforcement Learning Hanyang Zhao, Haoxian Chen, Ji Zhang, David Yao, Wenpin Tang

CVPR 2025 Skip Tuning: Pre-Trained Vision-Language Models Are Effective and Efficient Adapters Themselves Shihan Wu, Ji Zhang, Pengpeng Zeng, Lianli Gao, Jingkuan Song, Heng Tao Shen

CVPR 2025 SymDPO: Boosting In-Context Learning of Large Multimodal Models with Symbol Demonstration Direct Preference Optimization Hongrui Jia, Chaoya Jiang, Haiyang Xu, Wei Ye, Mengfan Dong, Ming Yan, Ji Zhang, Fei Huang, Shikun Zhang

NeurIPS 2025 VLM-R³: Region Recognition, Reasoning, and Refinement for Enhanced Multimodal Chain-of-Thought Chaoya Jiang, Yongrui Heng, Wei Ye, Haiyang Xu, Ming Yan, Ji Zhang, Fei Huang, Shikun Zhang

NeurIPS 2025 WritingBench: A Comprehensive Benchmark for Generative Writing Yuning Wu, Jiahao Mei, Ming Yan, Chenliang Li, Shaopeng Lai, Yuran Ren, Wang Zijia, Ji Zhang, Mengyue Wu, Qin Jin, Fei Huang

ICLR 2025 mPLUG-Owl3: Towards Long Image-Sequence Understanding in Multi-Modal Large Language Models Jiabo Ye, Haiyang Xu, Haowei Liu, Anwen Hu, Ming Yan, Qi Qian, Ji Zhang, Fei Huang, Jingren Zhou

IJCAI 2024 Breaking Barriers of System Heterogeneity: Straggler-Tolerant Multimodal Federated Learning via Knowledge Distillation Jinqian Chen, Haoyu Tang, Junhao Cheng, Ming Yan, Ji Zhang, Mingzhu Xu, Yupeng Hu, Liqiang Nie

CVPR 2024 DePT: Decoupled Prompt Tuning Ji Zhang, Shihan Wu, Lianli Gao, Heng Tao Shen, Jingkuan Song

IJCAI 2024 From Skepticism to Acceptance: Simulating the Attitude Dynamics Toward Fake News Yuhan Liu, Xiuying Chen, Xiaoqing Zhang, Xing Gao, Ji Zhang, Rui Yan

CVPR 2024 Hallucination Augmented Contrastive Learning for Multimodal Large Language Model Chaoya Jiang, Haiyang Xu, Mengfan Dong, Jiaxing Chen, Wei Ye, Ming Yan, Qinghao Ye, Ji Zhang, Fei Huang, Shikun Zhang

NeurIPS 2024 MaVEn: An Effective Multi-Granularity Hybrid Visual Encoding Framework for Multimodal Large Language Model Chaoya Jiang, Hongrui Jia, Haiyang Xu, Wei Ye, Mengfan Dong, Ming Yan, Ji Zhang, Fei Huang, Shikun Zhang

NeurIPS 2024 Mobile-Agent-V2: Mobile Device Operation Assistant with Effective Navigation via Multi-Agent Collaboration Junyang Wang, Haiyang Xu, Haitao Jia, Xi Zhang, Ming Yan, Weizhou Shen, Ji Zhang, Fei Huang, Jitao Sang

ICLRW 2024 Mobile-Agent: Autonomous Multi-Modal Mobile Device Agent with Visual Perception Junyang Wang, Haiyang Xu, Jiabo Ye, Ming Yan, Weizhou Shen, Ji Zhang, Fei Huang, Jitao Sang

CVPR 2024 SubT-MRS Dataset: Pushing SLAM Towards All-Weather Environments Shibo Zhao, Yuanjun Gao, Tianhao Wu, Damanpreet Singh, Rushan Jiang, Haoxiang Sun, Mansi Sarawata, Yuheng Qiu, Warren Whittaker, Ian Higgins, Yi Du, Shaoshu Su, Can Xu, John Keller, Jay Karhade, Lucas Nogueira, Sourojit Saha, Ji Zhang, Wenshan Wang, Chen Wang, Sebastian Scherer

AAAI 2024 TiMix: Text-Aware Image Mixing for Effective Vision-Language Pre-Training Chaoya Jiang, Wei Ye, Haiyang Xu, Qinghao Ye, Ming Yan, Ji Zhang, Shikun Zhang

CVPR 2024 mPLUG-Owl2: Revolutionizing Multi-Modal Large Language Model with Modality Collaboration Qinghao Ye, Haiyang Xu, Jiabo Ye, Ming Yan, Anwen Hu, Haowei Liu, Qi Qian, Ji Zhang, Fei Huang

ICML 2023 A Closer Look at Few-Shot Classification Again Xu Luo, Hao Wu, Ji Zhang, Lianli Gao, Jing Xu, Jingkuan Song

IJCAI 2023 ContrastMotion: Self-Supervised Scene Motion Learning for Large-Scale LiDAR Point Clouds Xiangze Jia, Hui Zhou, Xinge Zhu, Yandong Guo, Ji Zhang, Yuexin Ma

ICCV 2023 DETA: Denoised Task Adaptation for Few-Shot Learning Ji Zhang, Lianli Gao, Xu Luo, Hengtao Shen, Jingkuan Song

ICCV 2023 HiTeA: Hierarchical Temporal-Aware Video-Language Pre-Training Qinghao Ye, Guohai Xu, Ming Yan, Haiyang Xu, Qi Qian, Ji Zhang, Fei Huang

ICLR 2023 Self-Supervised Category-Level Articulated Object Pose Estimation with Part-Level SE(3) Equivariance Xueyi Liu, Ji Zhang, Ruizhen Hu, Haibin Huang, He Wang, Li Yi

ECML-PKDD 2023 Uncovering Multivariate Structural Dependency for Analyzing Irregularly Sampled Time Series Zhen Wang, Ting Jiang, Zenghui Xu, Jianliang Gao, Ou Wu, Ke Yan, Ji Zhang

ICML 2023 mPLUG-2: A Modularized Multi-Modal Foundation Model Across Text, Image and Video Haiyang Xu, Qinghao Ye, Ming Yan, Yaya Shi, Jiabo Ye, Yuanhong Xu, Chenliang Li, Bin Bi, Qi Qian, Wei Wang, Guohai Xu, Ji Zhang, Songfang Huang, Fei Huang, Jingren Zhou

IJCAI 2022 DictBERT: Dictionary Description Knowledge Enhanced Language Model Pre-Training via Contrastive Learning Qianglong Chen, Feng-Lin Li, Guohai Xu, Ming Yan, Ji Zhang, Yin Zhang

AAAI 2022 Logit Perturbation Mengyang Li, Fengguang Su, Ou Wu, Ji Zhang

CVPR 2022 Shifting More Attention to Visual Backbone: Query-Modulated Refinement Networks for End-to-End Visual Grounding Jiabo Ye, Junfeng Tian, Ming Yan, Xiaoshan Yang, Xuwu Wang, Ji Zhang, Liang He, Xin Lin

CVPR 2021 Accurate Few-Shot Object Detection with Support-Query Mutual Guidance and Hybrid Loss Lu Zhang, Shuigeng Zhou, Jihong Guan, Ji Zhang

IJCAI 2021 AdaVQA: Overcoming Language Priors with Adapted Margin Cosine Loss Yangyang Guo, Liqiang Nie, Zhiyong Cheng, Feng Ji, Ji Zhang, Alberto Del Bimbo

IJCAI 2021 MDNN: A Multimodal Deep Neural Network for Predicting Drug-Drug Interaction Events Tengfei Lyu, Jianliang Gao, Ling Tian, Zhao Li, Peng Zhang, Ji Zhang

AAAI 2021 Testing Independence Between Linear Combinations for Causal Discovery Hao Zhang, Kun Zhang, Shuigeng Zhou, Jihong Guan, Ji Zhang

AAAI 2019 A Deep Cascade Model for Multi-Document Reading Comprehension Ming Yan, Jiangnan Xia, Chen Wu, Bin Bi, Zhongzhou Zhao, Ji Zhang, Luo Si, Rui Wang, Wei Wang, Haiqing Chen

AAAI 2019 Large-Scale Visual Relationship Understanding Ji Zhang, Yannis Kalantidis, Marcus Rohrbach, Manohar Paluri, Ahmed Elgammal, Mohamed Elhoseiny

CVPR 2017 Relationship Proposal Networks Ji Zhang, Mohamed Elhoseiny, Scott Cohen, Walter Chang, Ahmed Elgammal

AAAI 2010 Error Aware Monocular Visual Odometry Using Vertical Line Pairs for Small Robots in Urban Areas Ji Zhang, Dezhen Song

ICCV 2007 Simplifying the Reconstruction of 3D Models Using Parameter Elimination Daniel G. Aliaga, Ji Zhang, Mireille Boutin