Zhang, Boqiang

9 publications

NeurIPS 2025 CAPability: A Comprehensive Visual Caption Benchmark for Evaluating Both Correctness and Thoroughness Zhihang Liu, Chen-Wei Xie, Bin Wen, Feiwu Yu, JixuanChen, Pandeng Li, Boqiang Zhang, Nianzu Yang, YingluLi, Zuan Gao, Yun Zheng, Hongtao Xie

CVPR 2025 ECBench: Can Multi-Modal Foundation Models Understand the Egocentric World? a Holistic Embodied Cognition Benchmark Ronghao Dang, Yuqian Yuan, Wenqi Zhang, Yifei Xin, Boqiang Zhang, Long Li, Liuyi Wang, Qinyang Zeng, Xin Li, Lidong Bing

CVPR 2025 SynTab-LLaVA: Enhancing Multimodal Table Understanding with Decoupled Synthesis Bangbang Zhou, Zuan Gao, Zixiao Wang, Boqiang Zhang, Yuxin Wang, Zhineng Chen, Hongtao Xie

CVPR 2025 VideoRefer Suite: Advancing Spatial-Temporal Object Understanding with Video LLM Yuqian Yuan, Hang Zhang, Wentong Li, Zesen Cheng, Boqiang Zhang, Long Li, Xin Li, Deli Zhao, Wenqiao Zhang, Yueting Zhuang, Jianke Zhu, Lidong Bing

CVPR 2024 Choose What You Need: Disentangled Representation Learning for Scene Text Recognition Removal and Editing Boqiang Zhang, Hongtao Xie, Zuan Gao, Yuxin Wang

IJCAI 2024 Focus on the Whole Character: Discriminative Character Modeling for Scene Text Recognition Bangbang Zhou, Yadong Qu, Zixiao Wang, Zicheng Li, Boqiang Zhang, Hongtao Xie

NeurIPS 2024 How Control Information Influences Multilingual Text Image Generation and Editing? Boqiang Zhang, Zuan Gao, Yadong Qu, Hongtao Xie

IJCAI 2024 Self-Supervised Pre-Training with Symmetric Superimposition Modeling for Scene Text Recognition Zuan Gao, Yuxin Wang, Yadong Qu, Boqiang Zhang, Zixiao Wang, Jianjun Xu, Hongtao Xie

IJCAI 2023 Linguistic More: Taking a Further Step Toward Efficient and Accurate Scene Text Recognition Boqiang Zhang, Hongtao Xie, Yuxin Wang, Jianjun Xu, Yongdong Zhang