Fu, Pei

6 publications

ICCV 2025 A Token-Level Text Image Foundation Model for Document Understanding Tongkun Guan, Zining Wang, Pei Fu, Zhengtao Guo, Wei Shen, Kai Zhou, Tiezhu Yue, Chen Duan, Hao Sun, Qianyi Jiang, Junfeng Luo, Xiaokang Yang

NeurIPS 2025 BTL-UI: Blink-Think-Link Reasoning Model for GUI Agent Shaojie Zhang, Ruoceng Zhang, Pei Fu, Shaokang Wang, Jiahui Yang, Xin Du, ShiqiCui, Bin Qin, Ying Huang, Zhenbo Luo, Jian Luan

AAAI 2025 InstructOCR: Instruction Boosting Scene Text Spotting Chen Duan, Qianyi Jiang, Pei Fu, Jiamin Chen, Shengxi Li, Zining Wang, Shan Guo, Junfeng Luo

CVPR 2025 Marten: Visual Question Answering with Mask Generation for Multi-Modal Document Understanding Zining Wang, Tongkun Guan, Pei Fu, Chen Duan, Qianyi Jiang, Zhentao Guo, Shan Guo, Junfeng Luo, Wei Shen, Xiaokang Yang

CVPR 2024 ODM: A Text-Image Further Alignment Pre-Training Approach for Scene Text Detection and Spotting Chen Duan, Pei Fu, Shan Guo, Qianyi Jiang, Xiaoming Wei

CVPRW 2020 VOC-RelD: Vehicle Re-Identification Based on Vehicle-Orientation-Camera Xiangyu Zhu, Zhenbo Luo, Pei Fu, Xiang Ji