Cao, Meng

36 publications

TMLR 2026 COLT: Enhancing Video Large Language Models with Continual Tool Usage Yuyang Liu, Meng Cao, Xinyuan Shi, Xiaodan Liang

TMLR 2026 Order from Chaos: Physical World Understanding from Glitchy Gameplay Videos Meng Cao, Haoran Tang, Haoze Zhao, Mingfei Han, Ruyang Liu, Qiang Sun, Xiaojun Chang, Ian Reid, Xiaodan Liang

ICCV 2025 A0: An Affordance-Aware Hierarchical Model for General Robotic Manipulation Rongtao Xu, Jian Zhang, Minghao Guo, Youpeng Wen, Haoting Yang, Min Lin, Jianzheng Huang, Zhe Li, Kaidong Zhang, Liqiong Wang, Yuxuan Kuang, Meng Cao, Feng Zheng, Xiaodan Liang

AAAI 2025 AnyTalk: Multi-Modal Driven Multi-Domain Talking Head Generation Yu Wang, Yunfei Liu, Fa-Ting Hong, Meng Cao, Lijian Lin, Yu Li

NeurIPS 2025 Checklists Are Better than Reward Models for Aligning Language Models Vijay Viswanathan, Yanchao Sun, Xiang Kong, Meng Cao, Graham Neubig, Tongshuang Wu

ICML 2025 Contrastive Localized Language-Image Pre-Training Hong-You Chen, Zhengfeng Lai, Haotian Zhang, Xinze Wang, Marcin Eichner, Keen You, Meng Cao, Bowen Zhang, Yinfei Yang, Zhe Gan

MLOSS 2025 Depyf: Open the Opaque Box of PyTorch Compiler for Machine Learning Researchers Kaichao You, Runsheng Bai, Meng Cao, Jianmin Wang, Ion Stoica, Mingsheng Long

ICCV 2025 ETVA: Evaluation of Text-to-Video Alignment via Fine-Grained Question Generation and Answering Kaisi Guan, Zhengfeng Lai, Yuchong Sun, Peng Zhang, Wei Liu, Kieran Liu, Meng Cao, Ruihua Song

ICCV 2025 EvaGaussians: Event Stream Assisted Gaussian Splatting from Blurry Images Wangbo Yu, Chaoran Feng, Jianing Li, Jiye Tang, Jiashu Yang, Zhenyu Tang, Meng Cao, Xu Jia, Yuchao Yang, Li Yuan, Yonghong Tian

AAAI 2025 MUSE: Mamba Is Efficient Multi-Scale Learner for Text-Video Retrieval Haoran Tang, Meng Cao, Jinfa Huang, Ruyang Liu, Peng Jin, Ge Li, Xiaodan Liang

NeurIPS 2025 PhyBlock: A Progressive Benchmark for Physical Understanding and Planning via 3D Block Assembly Liang Ma, Jiajun Wen, Min Lin, Rongtao Xu, Xiwen Liang, Bingqian Lin, Jun Ma, Yongxin Wang, Ziming Wei, Haokun Lin, Mingfei Han, Meng Cao, Bokui Chen, Ivan Laptev, Xiaodan Liang

ICLR 2025 Revisit Large-Scale Image-Caption Data in Pre-Training Multimodal Foundation Models Zhengfeng Lai, Vasileios Saveris, Chen Chen, Hong-You Chen, Haotian Zhang, Bowen Zhang, Wenze Hu, Juan Lao Tebar, Zhe Gan, Peter Grasch, Meng Cao, Yinfei Yang

NeurIPS 2025 StreamBridge: Turning Your Offline Video Large Language Model into a Proactive Streaming Assistant Haibo Wang, Bo Feng, Zhengfeng Lai, Mingze Xu, Shiyu Li, Weifeng Ge, Afshin Dehghan, Meng Cao, Ping Huang

NeurIPS 2025 SuperGPQA: Scaling LLM Evaluation Across 285 Graduate Disciplines Xeron Du, Yifan Yao, Kaijing Ma, Bingli Wang, Tianyu Zheng, King Zhu, Minghao Liu, Yiming Liang, Xiaolong Jin, Zhenlin Wei, Chujie Zheng, Kaixin Deng, Shuyue Guo, Shian Jia, Sichao Jiang, Yiyan Liao, Rui Li, Qinrui Li, Sirun Li, Yizhi Li, Yunwen Li, Dehua Ma, Yuansheng Ni, Haoran Que, Qiyao Wang, Zhoufutu Wen, Siwei Wu, Tianshun Xing, 许明, Zhenzhu Yang, Zekun Moore Wang, Junting Zhou, Yuelin Bai, Xingyuan Bu, Chenglin Cai, Liang Chen, Yifan Chen, Cheng Chengtuo, Tianhao Cheng, Keyi Ding, Siming Huang, Huang Yun, Yaoru Li, Yizhe Li, Zhaoqun Li, Tianhao Liang, Chengdong Lin, Hongquan Lin, Yinghao Ma, Z.Y. Peng, Zifan Peng, Qige Qi, Shi Qiu, Xingwei Qu, Shanghaoran Quan, Yizhou Tan, Zili Wang, 王晨清, Hao Wang, Yiya Wang, Yubo Wang, Jiajun Xu, Kexin Yang, Ruibin Yuan, Yuanhao Yue, Tianyang Zhan, Chun Zhang, Jinyang Zhang, Xiyue Zhang, Owen Xingjian Zhang, Yue Zhang, Yongchi Zhao, Xiangyu Zheng, ChenghuaZhong, Yang Gao, Zhoujun Li, Dayiheng Liu, Qian Liu, Tianyu Liu, Shiwen Ni, Junran Peng, Yujia Qin, Wenbo Su, Guoyin Wang, Shi Wang, Jian Yang, Min Yang, Meng Cao, Xiang Yue, Zhaoxiang Zhang, Wangchunshu Zhou, Jiaheng Liu, Qunshu Lin, Wenhao Huang, Ge Zhang

ICLR 2025 TIS-DPO: Token-Level Importance Sampling for Direct Preference Optimization with Estimated Weights Aiwei Liu, Haoping Bai, Zhiyun Lu, Yanchao Sun, Xiang Kong, Xiaoming Simon Wang, Jiulong Shan, Albin Madappally Jose, Xiaojiang Liu, Lijie Wen, Philip S. Yu, Meng Cao

AAAI 2025 TimeCHEAT: A Channel Harmony Strategy for Irregularly Sampled Multivariate Time Series Analysis Jiexi Liu, Meng Cao, Songcan Chen

ICLR 2024 Efficient ConvBN Blocks for Transfer Learning and Beyond Kaichao You, Guo Qin, Anchang Bao, Meng Cao, Ping Huang, Jiulong Shan, Mingsheng Long

WACV 2024 Empowering Unsupervised Domain Adaptation with Large-Scale Pre-Trained Vision-Language Models Zhengfeng Lai, Haoping Bai, Haotian Zhang, Xianzhi Du, Jiulong Shan, Yinfei Yang, Chen-Nee Chuah, Meng Cao

AAAI 2024 Exploiting Auxiliary Caption for Video Grounding Hongxiang Li, Meng Cao, Xuxin Cheng, Yaowei Li, Zhihong Zhu, Yuexian Zou

NeurIPS 2024 How to Continually Adapt Text-to-Image Diffusion Models for Flexible Customization? Jiahua Dong, Wenqi Liang, Hongliu Li, Duzhen Zhang, Meng Cao, Henghui Ding, Salman Khan, Fahad Shahbaz Khan

AAAI 2024 Mixup-Induced Domain Extrapolation for Domain Generalization Meng Cao, Songcan Chen

CVPR 2024 Real-Time Exposure Correction via Collaborative Transformations and Adaptive Sampling Ziwen Li, Feng Zhang, Meng Cao, Jinpu Zhang, Yuanjie Shao, Yuehuan Wang, Nong Sang

ICML 2024 Successor Features for Efficient Multi-Subject Controlled Text Generation Meng Cao, Mehdi Fatemi, Jackie Ck Cheung, Samira Shabanian

ECCV 2024 Uncertainty-Aware Sign Language Video Retrieval with Probability Distribution Modeling Xuan Wu, Hongxiang Li, Yuanjiang Luo, Xuxin Cheng, Xianwei Zhuang, Meng Cao, Keren Fu

ECCV 2024 VeCLIP: Improving CLIP Training via Visual-Enriched Captions Zhengfeng Lai, Haotian Zhang, Bowen Zhang, Wentao Wu, Haoping Bai, Aleksei Timofeev, Xianzhi Du, Zhe Gan, Jiulong Shan, Chen-Nee Chuah, Yinfei Yang, Meng Cao

ICCV 2023 G2L: Semantically Aligned and Uniform Video Grounding via Geodesic and Game Theory Hongxiang Li, Meng Cao, Xuxin Cheng, Yaowei Li, Zhihong Zhu, Yuexian Zou

CVPR 2023 Iterative Proposal Refinement for Weakly-Supervised Video Grounding Meng Cao, Fangyun Wei, Can Xu, Xiubo Geng, Long Chen, Can Zhang, Yuexian Zou, Tao Shen, Daxin Jiang

ICLR 2023 RGI: Robust GAN-Inversion for Mask-Free Image Inpainting and Unsupervised Pixel-Wise Anomaly Detection Shancong Mou, Xiaoyi Gu, Meng Cao, Haoping Bai, Ping Huang, Jiulong Shan, Jianjun Shi

ICLR 2023 Systematic Rectification of Language Models via Dead-End Analysis Meng Cao, Mehdi Fatemi, Jackie CK Cheung, Samira Shabanian

ICLR 2022 Information Gain Propagation: A New Way to Graph Active Learning with Soft Labels Wentao Zhang, Yexin Wang, Zhenbang You, Meng Cao, Ping Huang, Jiulong Shan, Zhi Yang, Bin Cui

ECCV 2022 LocVTP: Video-Text Pre-Training for Temporal Localization Meng Cao, Tianyu Yang, Junwu Weng, Can Zhang, Jue Wang, Yuexian Zou

CVPR 2022 Unsupervised Pre-Training for Temporal Action Localization Tasks Can Zhang, Tianyu Yang, Junwu Weng, Meng Cao, Jue Wang, Yuexian Zou

NeurIPS 2021 BatchQuant: Quantized-for-All Architecture Search with Robust Quantizer Haoping Bai, Meng Cao, Ping Huang, Jiulong Shan

CVPR 2021 CoLA: Weakly-Supervised Temporal Action Localization with Snippet Contrastive Learning Can Zhang, Meng Cao, Dongming Yang, Jie Chen, Yuexian Zou

NeurIPS 2021 RIM: Reliable Influence-Based Active Learning on Graphs Wentao Zhang, Yexin Wang, Zhenbang You, Meng Cao, Ping Huang, Jiulong Shan, Zhi Yang, Bin Cui

IJCAI 2021 RR-Net: Injecting Interactive Semantics in Human-Object Interaction Detection Dongming Yang, Yuexian Zou, Can Zhang, Meng Cao, Jie Chen