Hu, Anwen

8 publications

ICLR 2025 mPLUG-Owl3: Towards Long Image-Sequence Understanding in Multi-Modal Large Language Models Jiabo Ye, Haiyang Xu, Haowei Liu, Anwen Hu, Ming Yan, Qi Qian, Ji Zhang, Fei Huang, Jingren Zhou

CVPR 2024 mPLUG-Owl2: Revolutionizing Multi-Modal Large Language Model with Modality Collaboration Qinghao Ye, Haiyang Xu, Jiabo Ye, Ming Yan, Anwen Hu, Haowei Liu, Qi Qian, Ji Zhang, Fei Huang

AAAI 2023 Accommodating Audio Modality in CLIP for Multimodal Processing Ludan Ruan, Anwen Hu, Yuqing Song, Liang Zhang, Sipeng Zheng, Qin Jin

ICCV 2023 Explore and Tell: Embodied Visual Captioning in 3D Environments Anwen Hu, Shizhe Chen, Liang Zhang, Qin Jin

NeurIPS 2023 Learning Descriptive Image Captioning via Semipermeable Maximum Likelihood Estimation Zihao Yue, Anwen Hu, Liang Zhang, Qin Jin

AAAI 2023 MPMQA: Multimodal Question Answering on Product Manuals Liang Zhang, Anwen Hu, Jing Zhang, Shuo Hu, Qin Jin

NeurIPS 2022 Multi-Lingual Acquisition on Multimodal Pre-Training for Cross-Modal Retrieval Liang Zhang, Anwen Hu, Qin Jin

AAAI 2020 Leveraging Multi-Token Entities in Document-Level Named Entity Recognition Anwen Hu, Zhicheng Dou, Jian-Yun Nie, Ji-Rong Wen