Diao, Haiwen

11 publications

ICLR 2026 From Pixels to Words -- Towards Native Vision-Language Primitives at Scale Haiwen Diao, Mingxuan Li, Silei Wu, Linjun Dai, Xiaohua Wang, Hanming Deng, Lewei Lu, Dahua Lin, Ziwei Liu

ICLR 2026 Visual Jigsaw Post-Training Improves MLLMs Penghao Wu, Yushan Zhang, Haiwen Diao, Bo Li, Lewei Lu, Ziwei Liu

ICLR 2025 Autoregressive Video Generation Without Vector Quantization Haoge Deng, Ting Pan, Haiwen Diao, Zhengxiong Luo, Yufeng Cui, Huchuan Lu, Shiguang Shan, Yonggang Qi, Xinlong Wang

ICCV 2025 EVEv2: Improved Baselines for Encoder-Free Vision-Language Models Haiwen Diao, Xiaotong Li, Yufeng Cui, Yueze Wang, Haoge Deng, Ting Pan, Wenxuan Wang, Huchuan Lu, Xinlong Wang

NeurIPS 2025 End-to-End Vision Tokenizer Tuning Wenxuan Wang, Fan Zhang, Yufeng Cui, Haiwen Diao, Zhuoyan Luo, Huchuan Lu, Jing Liu, Xinlong Wang

NeurIPS 2024 DenseFusion-1m: Merging Vision Experts for Comprehensive Multimodal Perception Xiaotong Li, Fan Zhang, Haiwen Diao, Yueze Wang, Xinlong Wang, Ling-Yu Duan

NeurIPS 2024 LLMs Can Evolve Continually on Modality for $\mathbb{X}$-Modal Reasoning Jiazuo Yu, Haomiao Xiong, Lu Zhang, Haiwen Diao, Yunzhi Zhuge, Lanqing Hong, Dong Wang, Huchuan Lu, You He, Long Chen

ECCV 2024 SHERL: Synthesizing High Accuracy and Efficient Memory for Resource-Limited Transfer Learning Haiwen Diao, Bo Wan, Xu Jia, Yunzhi Zhuge, Ying Zhang, Huchuan Lu, Long Chen

CVPR 2024 UniPT: Universal Parallel Tuning for Transfer Learning with Efficient Parameter and Memory Haiwen Diao, Bo Wan, Ying Zhang, Xu Jia, Huchuan Lu, Long Chen

NeurIPS 2024 Unveiling Encoder-Free Vision-Language Models Haiwen Diao, Yufeng Cui, Xiaotong Li, Yueze Wang, Huchuan Lu, Xinlong Wang

AAAI 2021 Similarity Reasoning and Filtration for Image-Text Matching Haiwen Diao, Ying Zhang, Lin Ma, Huchuan Lu