Li, Dongxu

22 publications

ICLRW 2025 Aria-UI: Visual Grounding for GUI Instructions Yuhao Yang, Yue Wang, Dongxu Li, Ziyang Luo, Bei Chen, Chao Huang, Junnan Li

CVPR 2025 EZSR: Event-Based Zero-Shot Recognition Yan Yang, Liyuan Pan, Dongxu Li, Liu Liu

CVPR 2025 VideoAutoArena: An Automated Arena for Evaluating Large Multimodal Models in Video Analysis Through User Simulation Ziyang Luo, Haoning Wu, Dongxu Li, Jing Ma, Mohan Kankanhalli, Junnan Li

NeurIPS 2024 LongVideoBench: A Benchmark for Long-Context Interleaved Video-Language Understanding Haoning Wu, Dongxu Li, Bei Chen, Junnan Li

ECCV 2024 X-InstructBLIP: A Framework for Aligning Image, 3D, Audio, Video to LLMs and Its Emergent Cross-Modal Reasoning Artemis Panagopoulou, Le Xue, Ning Yu, Li Junnan, Dongxu Li, Shafiq Joty, Ran Xu, Silvio Savarese, Caiming Xiong, Juan Carlos Niebles

ICML 2023 BLIP-2: Bootstrapping Language-Image Pre-Training with Frozen Image Encoders and Large Language Models Junnan Li, Dongxu Li, Silvio Savarese, Steven Hoi

NeurIPS 2023 BLIP-Diffusion: Pre-Trained Subject Representation for Controllable Text-to-Image Generation and Editing Dongxu Li, Junnan Li, Steven C. Hoi

CVPR 2023 From Images to Textual Prompts: Zero-Shot Visual Question Answering with Frozen Large Language Models Jiaxian Guo, Junnan Li, Dongxu Li, Anthony Meng Huat Tiong, Boyang Li, Dacheng Tao, Steven Hoi

NeurIPS 2023 InstructBLIP: Towards General-Purpose Vision-Language Models with Instruction Tuning Wenliang Dai, Junnan Li, Dongxu Li, Anthony Tiong, Junqi Zhao, Weisheng Wang, Boyang Li, Pascale N Fung, Steven C. Hoi

TMLR 2023 Linearized Relative Positional Encoding Zhen Qin, Weixuan Sun, Kaiyue Lu, Hui Deng, Dongxu Li, Xiaodong Han, Yuchao Dai, Lingpeng Kong, Yiran Zhong

ICLR 2023 Toeplitz Neural Network for Sequence Modeling Zhen Qin, Xiaodong Han, Weixuan Sun, Bowen He, Dong Li, Dongxu Li, Yuchao Dai, Lingpeng Kong, Yiran Zhong

CVPR 2022 Align and Prompt: Video-and-Language Pre-Training with Entity Prompts Dongxu Li, Junnan Li, Hongdong Li, Juan Carlos Niebles, Steven C.H. Hoi

ICML 2022 BLIP: Bootstrapping Language-Image Pre-Training for Unified Vision-Language Understanding and Generation Junnan Li, Dongxu Li, Caiming Xiong, Steven Hoi

ACML 2022 Contrastive Inductive Bias Controlling Networks for Reinforcement Learning Dongxu Li, Shaochen Wang, Kang Chen, Bin Li

AAAI 2022 Towards Explainable Action Recognition by Salient Qualitative Spatial Object Relation Chains Hua Hua, Dongxu Li, Ruiqi Li, Peng Zhang, Jochen Renz, Anthony G. Cohn

AAAI 2022 Transcribing Natural Languages for the Deaf via Neural Editing Programs Dongxu Li, Chenchen Xu, Liu Liu, Yiran Zhong, Rong Wang, Lars Petersson, Hongdong Li

ICLR 2022 cosFormer: Rethinking SoftMax in Attention Zhen Qin, Weixuan Sun, Hui Deng, Dongxu Li, Yunshen Wei, Baohong Lv, Junjie Yan, Lingpeng Kong, Yiran Zhong

CVPR 2021 ARVo: Learning All-Range Volumetric Correspondence for Video Deblurring Dongxu Li, Chenchen Xu, Kaihao Zhang, Xin Yu, Yiran Zhong, Wenqi Ren, Hanna Suominen, Hongdong Li

ICCV 2021 Benchmarking Ultra-High-Definition Image Super-Resolution Kaihao Zhang, Dongxu Li, Wenhan Luo, Wenqi Ren, Björn Stenger, Wei Liu, Hongdong Li, Ming-Hsuan Yang

NeurIPS 2020 TSPNet: Hierarchical Feature Learning via Temporal Semantic Pyramid for Sign Language Translation Dongxu Li, Chenchen Xu, Xin Yu, Kaihao Zhang, Benjamin Swift, Hanna Suominen, Hongdong Li

WACV 2020 Word-Level Deep Sign Language Recognition from Video: A New Large-Scale Dataset and Methods Comparison Dongxu Li, Cristian Rodriguez, Xin Yu, Hongdong Li

IJCAI 2018 Effect-Abstraction Based Relaxation for Linear Numeric Planning Dongxu Li, Enrico Scala, Patrik Haslum, Sergiy Bogomolov