Lu, Tong

43 publications

ICLR 2025 CG-Bench: Clue-Grounded Question Answering Benchmark for Long Video Understanding Guo Chen, Yicheng Liu, Yifei Huang, Baoqi Pei, Jilan Xu, Yuping He, Tong Lu, Yali Wang, Limin Wang

AAAI 2025 Deconfound Semantic Shift and Incompleteness in Incremental Few-Shot Semantic Segmentation Yirui Wu, Yuhang Xia, Hao Li, Lixin Yuan, Junyang Chen, Jun Liu, Tong Lu, Shaohua Wan

CVPR 2025 Docopilot: Improving Multimodal Models for Document-Level Understanding Yuchen Duan, Zhe Chen, Yusong Hu, Weiyun Wang, Shenglong Ye, Botian Shi, Lewei Lu, Qibin Hou, Tong Lu, Hongsheng Li, Jifeng Dai, Wenhai Wang

NeurIPS 2025 Eagle 2.5: Boosting Long-Context Post-Training for Frontier Vision-Language Models Guo Chen, Zhiqi Li, Shihao Wang, Jindong Jiang, Yicheng Liu, Lidong Lu, De-An Huang, Wonmin Byeon, Matthieu Le, Max Ehrlich, Tong Lu, Limin Wang, Bryan Catanzaro, Jan Kautz, Andrew Tao, Zhiding Yu, Guilin Liu

NeurIPS 2025 EgoExoBench: A Benchmark for First- and Third-Person View Video Understanding in MLLMs Yuping He, Yifei Huang, Guo Chen, Baoqi Pei, Jilan Xu, Tong Lu, Jiangmiao Pang

IJCAI 2025 Egocentric Object-Interaction Anticipation with Retentive and Predictive Learning Guo Chen, Yifei Huang, Yin-Dong Zheng, Yicheng Liu, Jiahao Wang, Tong Lu

ICCV 2025 MOERL: When Mixture-of-Experts Meet Reinforcement Learning for Adverse Weather Image Restoration Tao Wang, Peiwen Xia, Bo Li, Peng-Tao Jiang, Zhe Kong, Kaihao Zhang, Tong Lu, Wenhan Luo

ICLR 2025 OmniCorpus: A Unified Multimodal Corpus of 10 Billion-Level Images Interleaved with Text Qingyun Li, Zhe Chen, Weiyun Wang, Wenhai Wang, Shenglong Ye, Zhenjiang Jin, Guanzhou Chen, Yinan He, Zhangwei Gao, Erfei Cui, Jiashuo Yu, Hao Tian, Jiasheng Zhou, Chao Xu, Bin Wang, Xingjian Wei, Wei Li, Wenjian Zhang, Bo Zhang, Pinlong Cai, Licheng Wen, Xiangchao Yan, Pei Chu, Yi Wang, Min Dou, Changyao Tian, Xizhou Zhu, Lewei Lu, Yushi Chen, Junjun He, Tong Lu, Yali Wang, Limin Wang, Dahua Lin, Yu Qiao, Botian Shi, Conghui He, Jifeng Dai

ICLR 2025 Vision-RWKV: Efficient and Scalable Visual Perception with RWKV-like Architectures Yuchen Duan, Weiyun Wang, Zhe Chen, Xizhou Zhu, Lewei Lu, Tong Lu, Yu Qiao, Hongsheng Li, Jifeng Dai, Wenhai Wang

AAAI 2024 AVSegFormer: Audio-Visual Segmentation with Transformer Shengyi Gao, Zhe Chen, Guo Chen, Wenhai Wang, Tong Lu

AAAI 2024 CRA-PCN: Point Cloud Completion with Intra- and Inter-Level Cross-Resolution Transformers Yi Rong, Haoran Zhou, Lixin Yuan, Cheng Mei, Jiahao Wang, Tong Lu

CVPR 2024 Efficient Deformable ConvNets: Rethinking Dynamic and Sparse Operator for Vision Applications Yuwen Xiong, Zhiqi Li, Yuntao Chen, Feng Wang, Xizhou Zhu, Jiapeng Luo, Wenhai Wang, Tong Lu, Hongsheng Li, Yu Qiao, Lewei Lu, Jie Zhou, Jifeng Dai

CVPR 2024 InternVL: Scaling up Vision Foundation Models and Aligning for Generic Visual-Linguistic Tasks Zhe Chen, Jiannan Wu, Wenhai Wang, Weijie Su, Guo Chen, Sen Xing, Muyan Zhong, Qinglong Zhang, Xizhou Zhu, Lewei Lu, Bin Li, Ping Luo, Tong Lu, Yu Qiao, Jifeng Dai

CVPR 2024 Is Ego Status All You Need for Open-Loop End-to-End Autonomous Driving? Zhiqi Li, Zhiding Yu, Shiyi Lan, Jiahan Li, Jan Kautz, Tong Lu, Jose M. Alvarez

CVPR 2024 RepKPU: Point Cloud Upsampling with Kernel Point Representation and Deformation Yi Rong, Haoran Zhou, Kang Xia, Cheng Mei, Jiahao Wang, Tong Lu

ICLR 2024 The All-Seeing Project: Towards Panoptic Visual Recognition and Understanding of the Open World Weiyun Wang, Min Shi, Qingyun Li, Wenhai Wang, Zhenhang Huang, Linjie Xing, Zhe Chen, Hao Li, Xizhou Zhu, Zhiguo Cao, Yushi Chen, Tong Lu, Jifeng Dai, Yu Qiao

NeurIPS 2024 VisionLLM V2: An End-to-End Generalist Multimodal Large Language Model for Hundreds of Vision-Language Tasks Jiannan Wu, Muyan Zhong, Sen Xing, Zeqiang Lai, Zhaoyang Liu, Zhe Chen, Wenhai Wang, Xizhou Zhu, Lewei Lu, Tong Lu, Ping Luo, Yu Qiao, Jifeng Dai

ICCV 2023 DDP: Diffusion Model for Dense Visual Prediction Yuanfeng Ji, Zhe Chen, Enze Xie, Lanqing Hong, Xihui Liu, Zhaoqiang Liu, Tong Lu, Zhenguo Li, Ping Luo

ICCV 2023 FB-BEV: BEV Representation from Forward-Backward View Transformations Zhiqi Li, Zhiding Yu, Wenhai Wang, Anima Anandkumar, Tong Lu, Jose M. Alvarez

IJCAI 2023 Graph Propagation Transformer for Graph Representation Learning Zhe Chen, Hao Tan, Tao Wang, Tianrun Shen, Tong Lu, Qiuying Peng, Cheng Cheng, Yue Qi

CVPR 2023 InternImage: Exploring Large-Scale Vision Foundation Models with Deformable Convolutions Wenhai Wang, Jifeng Dai, Zhe Chen, Zhenhang Huang, Zhiqi Li, Xizhou Zhu, Xiaowei Hu, Tong Lu, Lewei Lu, Hongsheng Li, Xiaogang Wang, Yu Qiao

ICCV 2023 Memory-and-Anticipation Transformer for Online Action Understanding Jiahao Wang, Guo Chen, Yifei Huang, Limin Wang, Tong Lu

AAAI 2023 Ultra-High-Definition Low-Light Image Enhancement: A Benchmark and Transformer-Based Method Tao Wang, Kaihao Zhang, Tianrun Shen, Wenhan Luo, Björn Stenger, Tong Lu

ICLR 2023 Vision Transformer Adapter for Dense Predictions Zhe Chen, Yuchen Duan, Wenhai Wang, Junjun He, Tong Lu, Jifeng Dai, Yu Qiao

NeurIPS 2023 VisionLLM: Large Language Model Is Also an Open-Ended Decoder for Vision-Centric Tasks Wenhai Wang, Zhe Chen, Xiaokang Chen, Jiannan Wu, Xizhou Zhu, Gang Zeng, Ping Luo, Tong Lu, Jie Zhou, Yu Qiao, Jifeng Dai

ECCV 2022 BEVFormer: Learning Bird’s-Eye-View Representation from Multi-Camera Images via Spatiotemporal Transformers Zhiqi Li, Wenhai Wang, Hongyang Li, Enze Xie, Chonghao Sima, Tong Lu, Yu Qiao, Jifeng Dai

AAAI 2022 DCAN: Improving Temporal Action Detection via Dual Context Aggregation Guo Chen, Yin-Dong Zheng, Limin Wang, Tong Lu

JAIR 2022 On Efficient Reinforcement Learning for Full-Length Game of StarCraft II Ruo-Ze Liu, Zhen-Jia Pang, Zhou-Yu Meng, Wenhai Wang, Yang Yu, Tong Lu

CVPR 2022 Panoptic SegFormer: Delving Deeper into Panoptic Segmentation with Transformers Zhiqi Li, Wenhai Wang, Enze Xie, Zhiding Yu, Anima Anandkumar, Jose M. Alvarez, Ping Luo, Tong Lu

ECCV 2022 SeedFormer: Patch Seeds Based Point Cloud Completion with Upsample Transformer Haoran Zhou, Yun Cao, Wenqing Chu, Junwei Zhu, Tong Lu, Ying Tai, Chengjie Wang

AAAI 2022 Towards Ultra-Resolution Neural Style Transfer via Thumbnail Instance Normalization Zhe Chen, Wenhai Wang, Enze Xie, Tong Lu, Ping Luo

ICCV 2021 Adaptive Graph Convolution for Point Cloud Analysis Haoran Zhou, Yidan Feng, Mingsheng Fang, Mingqiang Wei, Jing Qin, Tong Lu

AAAI 2021 Frequency Consistent Adaptation for Real World Super Resolution Xiaozhong Ji, Guangpin Tao, Yun Cao, Ying Tai, Tong Lu, Chengjie Wang, Jilin Li, Feiyue Huang

ICCV 2021 Pyramid Vision Transformer: A Versatile Backbone for Dense Prediction Without Convolutions Wenhai Wang, Enze Xie, Xiang Li, Deng-Ping Fan, Kaitao Song, Ding Liang, Tong Lu, Ping Luo, Ling Shao

NeurIPS 2021 Spectrum-to-Kernel Translation for Accurate Blind Image Super-Resolution Guangpin Tao, Xiaozhong Ji, Wenzhuo Wang, Shuo Chen, Chuming Lin, Yun Cao, Tong Lu, Donghao Luo, Ying Tai

ICCV 2021 TAM: Temporal Adaptive Module for Video Recognition Zhaoyang Liu, Limin Wang, Wayne Wu, Chen Qian, Tong Lu

ECCV 2020 AE TextSpotter: Learning Visual and Linguistic Representation for Ambiguous Text Spotting Wenhai Wang, Xuebo Liu, Xiaozhong Ji, Enze Xie, Ding Liang, ZhiBo Yang, Tong Lu, Chunhua Shen, Ping Luo

AAAI 2020 TEINet: Towards an Efficient Architecture for Video Recognition Zhaoyang Liu, Donghao Luo, Yabiao Wang, Limin Wang, Ying Tai, Chengjie Wang, Jilin Li, Feiyue Huang, Tong Lu

AAAI 2019 On Reinforcement Learning for Full-Length Game of StarCraft Zhen-Jia Pang, Ruo-Ze Liu, Zhou-Yu Meng, Yi Zhang, Yang Yu, Tong Lu

IJCAI 2018 Mixed Link Networks Wenhai Wang, Xiang Li, Tong Lu, Jian Yang

IJCAI 2017 Deep-Dense Conditional Random Fields for Object Co-Segmentation Ze-Huan Yuan, Tong Lu, Yirui Wu

CVPR 2017 Temporal Action Localization by Structured Maximal Sums Zehuan Yuan, Jonathan C. Stroud, Tong Lu, Jia Deng

ECCV 2014 A Novel Topic-Level Random Walk Framework for Scene Image Co-Segmentation Ze-Huan Yuan, Tong Lu, Palaiahnakote Shivakumara