Li, Handong

5 publications

ICCV 2025 Breaking the Encoder Barrier for Seamless Video-Language Understanding Handong Li, Yiyuan Zhang, Longteng Guo, Xiangyu Yue, Jing Liu

ICCV 2025 Learning Beyond Still Frames: Scaling Vision-Language Models with Video Yiyuan Zhang, Handong Li, Jing Liu, Xiangyu Yue

ICCV 2025 Scaling Omni-Modal Pretraining with Multimodal Context: Advancing Universal Representation Learning Across Modalities Yiyuan Zhang, Handong Li, Jing Liu, Xiangyu Yue

ICLR 2024 COSA: Concatenated Sample Pretrained Vision-Language Foundation Model Sihan Chen, Xingjian He, Handong Li, Xiaojie Jin, Jiashi Feng, Jing Liu

NeurIPS 2023 VAST: A Vision-Audio-Subtitle-Text Omni-Modality Foundation Model and Dataset Sihan Chen, Handong Li, Qunbo Wang, Zijia Zhao, Mingzhen Sun, Xinxin Zhu, Jing Liu