Ye, Qinghao

13 publications

CVPR 2025 LLaVA-Critic: Learning to Evaluate Multimodal Models Tianyi Xiong, Xiyao Wang, Dong Guo, Qinghao Ye, Haoqi Fan, Quanquan Gu, Heng Huang, Chunyuan Li

NeurIPS 2025 MJ-Bench: Is Your Multimodal Reward Model Really a Good Judge for Text-to-Image Generation? Zhaorun Chen, Zichen Wen, Yichao Du, Yiyang Zhou, Chenhang Cui, Siwei Han, Zhenzhen Weng, Chaoqi Wang, Zhengwei Tong, Leria Huang, Canyu Chen, Haoqin Tu, Qinghao Ye, Zhihong Zhu, Yuqing Zhang, Jiawei Zhou, Zhuokai Zhao, Rafael Rafailov, Chelsea Finn, Huaxiu Yao

ICLR 2025 Painting with Words: Elevating Detailed Image Captioning with Benchmark and Alignment Learning Qinghao Ye, Xianhan Zeng, Fu Li, Chunyuan Li, Haoqi Fan

NeurIPS 2024 Classification Done Right for Vision-Language Pre-Training Zilong Huang, Qinghao Ye, Bingyi Kang, Jiashi Feng, Haoqi Fan

CVPR 2024 Hallucination Augmented Contrastive Learning for Multimodal Large Language Model Chaoya Jiang, Haiyang Xu, Mengfan Dong, Jiaxing Chen, Wei Ye, Ming Yan, Qinghao Ye, Ji Zhang, Fei Huang, Shikun Zhang

ICMLW 2024 MJ-Bench: Is Your Multimodal Reward Model Really a Good Judge? Zhaorun Chen, Yichao Du, Zichen Wen, Yiyang Zhou, Chenhang Cui, Zhenzhen Weng, Haoqin Tu, Chaoqi Wang, Zhengwei Tong, Leria Huang, Canyu Chen, Qinghao Ye, Zhihong Zhu, Yuqing Zhang, Jiawei Zhou, Zhuokai Zhao, Rafael Rafailov, Chelsea Finn, Huaxiu Yao

AAAI 2024 TiMix: Text-Aware Image Mixing for Effective Vision-Language Pre-Training Chaoya Jiang, Wei Ye, Haiyang Xu, Qinghao Ye, Ming Yan, Ji Zhang, Shikun Zhang

CVPR 2024 mPLUG-Owl2: Revolutionizing Multi-Modal Large Language Model with Modality Collaboration Qinghao Ye, Haiyang Xu, Jiabo Ye, Ming Yan, Anwen Hu, Haowei Liu, Qi Qian, Ji Zhang, Fei Huang

ICCV 2023 BUS: Efficient and Effective Vision-Language Pre-Training with Bottom-up Patch Summarization. Chaoya Jiang, Haiyang Xu, Wei Ye, Qinghao Ye, Chenliang Li, Ming Yan, Bin Bi, Shikun Zhang, Fei Huang, Songfang Huang

ICCV 2023 HiTeA: Hierarchical Temporal-Aware Video-Language Pre-Training Qinghao Ye, Guohai Xu, Ming Yan, Haiyang Xu, Qi Qian, Ji Zhang, Fei Huang

ICCV 2023 Learning Trajectory-Word Alignments for Video-Language Tasks Xu Yang, Zhangzikang Li, Haiyang Xu, Hanwang Zhang, Qinghao Ye, Chenliang Li, Ming Yan, Yu Zhang, Fei Huang, Songfang Huang

ICML 2023 mPLUG-2: A Modularized Multi-Modal Foundation Model Across Text, Image and Video Haiyang Xu, Qinghao Ye, Ming Yan, Yaya Shi, Jiabo Ye, Yuanhong Xu, Chenliang Li, Bin Bi, Qi Qian, Wei Wang, Guohai Xu, Ji Zhang, Songfang Huang, Fei Huang, Jingren Zhou

ICCV 2021 Temporal Cue Guided Video Highlight Detection with Low-Rank Audio-Visual Fusion Qinghao Ye, Xiyue Shen, Yuan Gao, Zirui Wang, Qi Bi, Ping Li, Guang Yang