Chen, Guo

19 publications

ICLR 2025 CG-Bench: Clue-Grounded Question Answering Benchmark for Long Video Understanding Guo Chen, Yicheng Liu, Yifei Huang, Baoqi Pei, Jilan Xu, Yuping He, Tong Lu, Yali Wang, Limin Wang

NeurIPS 2025 Eagle 2.5: Boosting Long-Context Post-Training for Frontier Vision-Language Models Guo Chen, Zhiqi Li, Shihao Wang, Jindong Jiang, Yicheng Liu, Lidong Lu, De-An Huang, Wonmin Byeon, Matthieu Le, Max Ehrlich, Tong Lu, Limin Wang, Bryan Catanzaro, Jan Kautz, Andrew Tao, Zhiding Yu, Guilin Liu

ICLR 2025 EgoExo-Gen: Ego-Centric Video Prediction by Watching Exo-Centric Videos Jilan Xu, Yifei Huang, Baoqi Pei, Junlin Hou, Qingqiu Li, Guo Chen, Yuejie Zhang, Rui Feng, Weidi Xie

NeurIPS 2025 EgoExoBench: A Benchmark for First- and Third-Person View Video Understanding in MLLMs Yuping He, Yifei Huang, Guo Chen, Baoqi Pei, Jilan Xu, Tong Lu, Jiangmiao Pang

NeurIPS 2025 EgoThinker: Unveiling Egocentric Reasoning with Spatio-Temporal CoT Baoqi Pei, Yifei Huang, Jilan Xu, Yuping He, Guo Chen, Fei Wu, Jiangmiao Pang, Yu Qiao

IJCAI 2025 Egocentric Object-Interaction Anticipation with Retentive and Predictive Learning Guo Chen, Yifei Huang, Yin-Dong Zheng, Yicheng Liu, Jiahao Wang, Tong Lu

ICLR 2025 Modeling Fine-Grained Hand-Object Dynamics for Egocentric Video Representation Learning Baoqi Pei, Yifei Huang, Jilan Xu, Guo Chen, Yuping He, Lijin Yang, Yali Wang, Weidi Xie, Yu Qiao, Fei Wu, Limin Wang

ICLR 2025 SonicSim: A Customizable Simulation Platform for Speech Processing in Moving Sound Source Scenarios Kai Li, Wendi Sang, Chang Zeng, Runxuan Yang, Guo Chen, Xiaolin Hu

ICLR 2025 TIGER: Time-Frequency Interleaved Gain Extraction and Reconstruction for Efficient Speech Separation Mohan Xu, Kai Li, Guo Chen, Xiaolin Hu

AAAI 2024 AVSegFormer: Audio-Visual Segmentation with Transformer Shengyi Gao, Zhe Chen, Guo Chen, Wenhai Wang, Tong Lu

CVPR 2024 EgoExoLearn: A Dataset for Bridging Asynchronous Ego- and Exo-Centric View of Procedural Activities in Real World Yifei Huang, Guo Chen, Jilan Xu, Mingfang Zhang, Lijin Yang, Baoqi Pei, Hongjie Zhang, Lu Dong, Yali Wang, Limin Wang, Yu Qiao

CVPR 2024 InternVL: Scaling up Vision Foundation Models and Aligning for Generic Visual-Linguistic Tasks Zhe Chen, Jiannan Wu, Wenhai Wang, Weijie Su, Guo Chen, Sen Xing, Muyan Zhong, Qinglong Zhang, Xizhou Zhu, Lewei Lu, Bin Li, Ping Luo, Tong Lu, Yu Qiao, Jifeng Dai

ICLR 2024 InternVid: A Large-Scale Video-Text Dataset for Multimodal Understanding and Generation Yi Wang, Yinan He, Yizhuo Li, Kunchang Li, Jiashuo Yu, Xin Ma, Xinhao Li, Guo Chen, Xinyuan Chen, Yaohui Wang, Ping Luo, Ziwei Liu, Yali Wang, Limin Wang, Yu Qiao

ECCV 2024 InternVideo2: Scaling Foundation Models for Multimodal Video Understanding Yi Wang, Kunchang Li, Xinhao Li, Jiashuo Yu, Yinan He, Guo Chen, Baoqi Pei, Rongkun Zheng, Jilan Xu, Zun Wang, Yansong Shi, Tianxiang Jiang, SongZe Li, Hongjie Zhang, Yifei Huang, Yu Qiao, Yali Wang, Limin Wang

CVPR 2024 MVBench: A Comprehensive Multi-Modal Video Understanding Benchmark Kunchang Li, Yali Wang, Yinan He, Yizhuo Li, Yi Wang, Yi Liu, Zun Wang, Jilan Xu, Guo Chen, Ping Luo, Limin Wang, Yu Qiao

ICML 2024 NeuralIndicator: Implicit Surface Reconstruction from Neural Indicator Priors Shi-Sheng Huang, Guo Chen, Chen Li Heng, Hua Huang

CVPR 2024 Retrieval-Augmented Egocentric Video Captioning Jilan Xu, Yifei Huang, Junlin Hou, Guo Chen, Yuejie Zhang, Rui Feng, Weidi Xie

ICCV 2023 Memory-and-Anticipation Transformer for Online Action Understanding Jiahao Wang, Guo Chen, Yifei Huang, Limin Wang, Tong Lu

AAAI 2022 DCAN: Improving Temporal Action Detection via Dual Context Aggregation Guo Chen, Yin-Dong Zheng, Limin Wang, Tong Lu