Ma, Zongyang

9 publications

NeurIPS 2025 UniPixel: Unified Object Referring and Segmentation for Pixel-Level Visual Reasoning Ye Liu, Zongyang Ma, Junfu Pu, Zhongang Qi, Yang Wu, Ying Shan, Chang Wen Chen

ICCV 2025 VisionMath: Vision-Form Mathematical Problem-Solving Zongyang Ma, Yuxin Chen, Ziqi Zhang, Zhongang Qi, Chunfeng Yuan, Shaojie Zhu, Chengxiang Zhuo, Bing Li, Ye Liu, Zang Li, Ying Shan, Weiming Hu

NeurIPS 2024 E.T. Bench: Towards Open-Ended Event-Level Video-Language Understanding Ye Liu, Zongyang Ma, Zhongang Qi, Yang Wu, Ying Shan, Chang Wen Chen

ECCV 2024 EA-VTR: Event-Aware Video-Text Retrieval Zongyang Ma, Ziqi Zhang, Yuxin Chen, Zhongang Qi, Chunfeng Yuan, Bing Li, Yingmin Luo, Xu Li, Xiaojuan Qi, Ying Shan, Weiming Hu

CVPR 2024 How to Make Cross Encoder a Good Teacher for Efficient Image-Text Retrieval? Yuxin Chen, Zongyang Ma, Ziqi Zhang, Zhongang Qi, Chunfeng Yuan, Bing Li, Junfu Pu, Ying Shan, Xiaojuan Qi, Weiming Hu

ICCV 2023 Order-Prompted Tag Sequence Generation for Video Tagging Zongyang Ma, Ziqi Zhang, Yuxin Chen, Zhongang Qi, Yingmin Luo, Zekun Li, Chunfeng Yuan, Bing Li, Xiaohu Qie, Ying Shan, Weiming Hu

CVPR 2023 ViLEM: Visual-Language Error Modeling for Image-Text Retrieval Yuxin Chen, Zongyang Ma, Ziqi Zhang, Zhongang Qi, Chunfeng Yuan, Ying Shan, Bing Li, Weiming Hu, Xiaohu Qie, Jianping Wu

CVPR 2022 Open-Vocabulary One-Stage Detection with Hierarchical Visual-Language Knowledge Distillation Zongyang Ma, Guan Luo, Jin Gao, Liang Li, Yuxin Chen, Shaoru Wang, Congxuan Zhang, Weiming Hu

AAAI 2015 A Tri-Role Topic Model for Domain-Specific Question Answering Zongyang Ma, Aixin Sun, Quan Yuan, Gao Cong