Sun, Chen

78 publications

ICLR 2025 Dense Video Object Captioning from Disjoint Supervision Xingyi Zhou, Anurag Arnab, Chen Sun, Cordelia Schmid

ICLR 2025 Fluid: Scaling Autoregressive Text-to-Image Generative Models with Continuous Tokens Lijie Fan, Tianhong Li, Siyang Qin, Yuanzhen Li, Chen Sun, Michael Rubinstein, Deqing Sun, Kaiming He, Yonglong Tian

NeurIPS 2025 Force Prompting: Video Generation Models Can Learn and Generalize Physics-Based Control Signals Nate Gillman, Charles Herrmann, Michael Freeman, Daksh Aggarwal, Evan Luo, Deqing Sun, Chen Sun

ICLR 2025 Fourier Head: Helping Large Language Models Learn Complex Probability Distributions Nate Gillman, Daksh Aggarwal, Michael Freeman, Chen Sun

ICLRW 2025 Fourier Head: Helping Large Language Models Learn Complex Probability Distributions Nate Gillman, Daksh Aggarwal, Michael Freeman, Saurabh Singh, Chen Sun

ICCV 2025 How Can Objects Help Video-Language Understanding? Zitian Tang, Shijie Wang, Junho Cho, Jaewook Yoo, Chen Sun

ICLR 2025 How New Data Permeates LLM Knowledge and How to Dilute It Chen Sun, Renat Aksitov, Andrey Zhmoginov, Nolan Andrew Miller, Max Vladymyrov, Ulrich Rueckert, Been Kim, Mark Sandler

CVPR 2025 HyperFree: A Channel-Adaptive and Tuning-Free Foundation Model for Hyperspectral Remote Sensing Imagery Jingtao Li, Yingyi Liu, Xinyu Wang, Yunning Peng, Chen Sun, Shaoyu Wang, Zhendong Sun, Tian Ke, Xiao Jiang, Tangwei Lu, Anran Zhao, Yanfei Zhong

WACV 2025 Learning Visual Grounding from Generative Vision and Language Model Shijie Wang, Dahun Kim, Ali Taalimi, Chen Sun, Weicheng Kuo

CVPR 2025 MotiF: Making Text Count in Image Animation with Motion Focal Loss Shijie Wang, Samaneh Azadi, Rohit Girdhar, Saketh Rambhatla, Chen Sun, Xi Yin

CVPR 2025 Motion Prompting: Controlling Video Generation with Motion Trajectories Daniel Geng, Charles Herrmann, Junhwa Hur, Forrester Cole, Serena Zhang, Tobias Pfaff, Tatiana Lopez-Guevara, Yusuf Aytar, Michael Rubinstein, Chen Sun, Oliver Wang, Andrew Owens, Deqing Sun

TMLR 2025 Pre-Trained Vision-Language Models Learn Discoverable Visual Concepts Yuan Zang, Tian Yun, Hao Tan, Trung Bui, Chen Sun

NeurIPS 2025 SAGE: A Unified Framework for Generalizable Object State Recognition with State-Action Graph Embedding Yuan Zang, Zitian Tang, Junho Cho, Jaewook Yoo, Chen Sun

ICLRW 2025 Self-Correcting Self-Consuming Loops for Generative Model Training Nate Gillman, Michael Freeman, Daksh Aggarwal, Chia-Hong Hsu, Calvin Luo, Yonglong Tian, Chen Sun

ICLR 2025 Solving New Tasks by Adapting Internet Video Knowledge Calvin Luo, Zilai Zeng, Yilun Du, Chen Sun

ICLRW 2025 Solving Robotic Tasks via Self-Adapting Improvement Loops with Internet Video Knowledge Calvin Luo, Zilai Zeng, Yilun Du, Chen Sun

ICLR 2024 AntGPT: Can Large Language Models Help Long-Term Action Anticipation from Videos? Qi Zhao, Shijie Wang, Ce Zhang, Changcheng Fu, Minh Quan Do, Nakul Agarwal, Kwonjoon Lee, Chen Sun

ICLR 2024 Delta-AI: Local Objectives for Amortized Inference in Sparse Graphical Models Jean-Pierre René Falet, Hae Beom Lee, Nikolay Malkin, Chen Sun, Dragos Secrieru, Dinghuai Zhang, Guillaume Lajoie, Yoshua Bengio

CVPR 2024 End-to-End Spatio-Temporal Action Localisation with Video Transformers Alexey A. Gritsenko, Xuehan Xiong, Josip Djolonga, Mostafa Dehghani, Chen Sun, Mario Lucic, Cordelia Schmid, Anurag Arnab

NeurIPSW 2024 How New Data Pollutes LLM Knowledge and How to Dilute It Chen Sun, Renat Aksitov, Andrey Zhmoginov, Nolan Andrew Miller, Max Vladymyrov, Ulrich Rueckert, Been Kim, Mark Sandler

ICMLW 2024 Learning and Unlearning of Fabricated Knowledge in Language Models Chen Sun, Nolan Andrew Miller, Andrey Zhmoginov, Max Vladymyrov, Mark Sandler

WACV 2024 Object-Centric Video Representation for Long-Term Action Anticipation Ce Zhang, Changcheng Fu, Shijie Wang, Nakul Agarwal, Kwonjoon Lee, Chiho Choi, Chen Sun

CVPR 2024 Pixel-Aligned Language Model Jiarui Xu, Xingyi Zhou, Shen Yan, Xiuye Gu, Anurag Arnab, Chen Sun, Xiaolong Wang, Cordelia Schmid

ICML 2024 Potential Based Diffusion Motion Planning Yunhao Luo, Chen Sun, Joshua B. Tenenbaum, Yilun Du

ICML 2024 Self-Correcting Self-Consuming Loops for Generative Model Training Nate Gillman, Michael Freeman, Daksh Aggarwal, Chia-Hong Hsu, Calvin Luo, Yonglong Tian, Chen Sun

NeurIPS 2024 Text-Aware Diffusion for Policy Learning Calvin Luo, Mandy He, Zilai Zeng, Chen Sun

ECCV 2024 Vamos: Versatile Action Models for Video Understanding Shijie Wang, Qi Zhao, Minh Quan Do, Nakul Agarwal, Kwonjoon Lee, Chen Sun

NeurIPS 2023 AVIS: Autonomous Visual Information Seeking with Large Language Model Agent Ziniu Hu, Ahmet Iscen, Chen Sun, Kai-Wei Chang, Yizhou Sun, David A. Ross, Cordelia Schmid, Alireza Fathi

NeurIPSW 2023 Changes in the Geometry of Hippocampal Representations Across Brain States Wannan Yang, Chen Sun, Gyorgy Buzsaki

NeurIPS 2023 Contrastive Retrospection: Honing in on Critical Steps for Rapid Learning and Generalization in RL Chen Sun, Wannan Yang, Thomas Jiralerspong, Dane Malenfant, Benjamin Alsbury-Nealy, Yoshua Bengio, Blake Richards

ICLR 2023 Deja Vu: Continual Model Generalization for Unseen Domains Chenxi Liu, Lixu Wang, Lingjuan Lyu, Chen Sun, Xiao Wang, Qi Zhu

NeurIPSW 2023 Discrete, Compositional, and Symbolic Representations Through Attractor Dynamics Andrew Joohun Nam, Eric Elmoznino, Nikolay Malkin, Chen Sun, Yoshua Bengio, Guillaume Lajoie

TMLR 2023 Do Vision-Language Pretrained Models Learn Composable Primitive Concepts? Tian Yun, Usha Bhalla, Ellie Pavlick, Chen Sun

NeurIPS 2023 Does Visual Pretraining Help End-to-End Reasoning? Chen Sun, Calvin Luo, Xingyi Zhou, Anurag Arnab, Cordelia Schmid

NeurIPS 2023 Goal-Conditioned Predictive Coding for Offline Reinforcement Learning Zilai Zeng, Ce Zhang, Shijie Wang, Chen Sun

NeurIPSW 2023 Goal-Conditioned Predictive Coding for Offline Reinforcement Learning Zilai Zeng, Ce Zhang, Shijie Wang, Chen Sun

CVPR 2023 How Can Objects Help Action Recognition? Xingyi Zhou, Anurag Arnab, Chen Sun, Cordelia Schmid

CVPR 2023 REVEAL: Retrieval-Augmented Visual-Language Pre-Training with Multi-Source Multimodal Knowledge Memory Ziniu Hu, Ahmet Iscen, Chen Sun, Zirui Wang, Kai-Wei Chang, Yizhou Sun, Cordelia Schmid, David A. Ross, Alireza Fathi

ECCV 2022 Learning Audio-Video Modalities from Image Captions Arsha Nagrani, Paul Hongsuck Seo, Bryan Seybold, Anja Hauth, Santiago Manen, Chen Sun, Cordelia Schmid

WACV 2022 Masking Modalities for Cross-Modal Video Retrieval Valentin Gabeur, Arsha Nagrani, Chen Sun, Karteek Alahari, Cordelia Schmid

CVPR 2022 Multiview Transformers for Video Recognition Shen Yan, Xuehan Xiong, Anurag Arnab, Zhichao Lu, Mi Zhang, Chen Sun, Cordelia Schmid

ECCV 2022 TL;DW? Summarizing Instructional Videos with Task Relevance & Cross-Modal Saliency Medhini Narasimhan, Arsha Nagrani, Chen Sun, Michael Rubinstein, Trevor Darrell, Anna Rohrbach, Cordelia Schmid

NeurIPS 2022 Trajectory Balance: Improved Credit Assignment in GFlowNets Nikolay Malkin, Moksh Jain, Emmanuel Bengio, Chen Sun, Yoshua Bengio

CVPRW 2021 A Watermarking-Based Framework for Protecting Deep Image Classifiers Against Adversarial Attacks Chen Sun, En-Hui Yang

NeurIPS 2021 Attention Bottlenecks for Multimodal Fusion Arsha Nagrani, Shan Yang, Anurag Arnab, Aren Jansen, Cordelia Schmid, Chen Sun

ICCV 2021 Composable Augmentation Encoding for Video Representation Learning Chen Sun, Arsha Nagrani, Yonglong Tian, Cordelia Schmid

ICCV 2021 DenseTNT: End-to-End Trajectory Prediction from Dense Goal Sets Junru Gu, Chen Sun, Hang Zhao

NeurIPS 2021 Discrete-Valued Neural Communication Dianbo Liu, Alex M Lamb, Kenji Kawaguchi, Anirudh Goyal ALIAS PARTH Goyal, Chen Sun, Michael Mozer, Yoshua Bengio

ICCV 2021 Episodic Transformer for Vision-and-Language Navigation Alexander Pashevich, Cordelia Schmid, Chen Sun

CVPR 2021 HDMapGen: A Hierarchical Graph Generative Model of High Definition Maps Lu Mi, Hang Zhao, Charlie Nash, Xiaohan Jin, Jiyang Gao, Chen Sun, Cordelia Schmid, Nir Shavit, Yuning Chai, Dragomir Anguelov

ICCV 2021 Learning Temporal Dynamics from Cycles in Narrated Video Dave Epstein, Jiajun Wu, Cordelia Schmid, Chen Sun

ICCV 2021 Unified Graph Structured Models for Video Understanding Anurag Arnab, Chen Sun, Cordelia Schmid

ICCV 2021 ViViT: A Video Vision Transformer Anurag Arnab, Mostafa Dehghani, Georg Heigold, Chen Sun, Mario Lučić, Cordelia Schmid

WACV 2020 D3D: Distilled 3D Networks for Video Action Recognition Jonathan Stroud, David Ross, Chen Sun, Jia Deng, Rahul Sukthankar

ECCV 2020 Multi-Modal Transformer for Video Retrieval Valentin Gabeur, Chen Sun, Karteek Alahari, Cordelia Schmid

CoRL 2020 TNT: Target-Driven Trajectory Prediction Hang Zhao, Jiyang Gao, Tian Lan, Chen Sun, Ben Sapp, Balakrishnan Varadarajan, Yue Shen, Yi Shen, Yuning Chai, Cordelia Schmid, Congcong Li, Dragomir Anguelov

ECCV 2020 Uncertainty-Aware Weakly Supervised Action Detection from Untrimmed Videos Anurag Arnab, Chen Sun, Arsha Nagrani, Cordelia Schmid

NeurIPS 2020 What Makes for Good Views for Contrastive Learning? Yonglong Tian, Chen Sun, Ben Poole, Dilip Krishnan, Cordelia Schmid, Phillip Isola

ICLR 2019 Stochastic Prediction of Multi-Agent Interactions from Partial Observations Chen Sun, Per Karlsson, Jiajun Wu, Joshua B Tenenbaum, Kevin Murphy

ICLR 2019 Unsupervised Discovery of Parts, Structure, and Dynamics Zhenjia Xu, Zhijian Liu, Chen Sun, Kevin Murphy, William T. Freeman, Joshua B. Tenenbaum, Jiajun Wu

NeurIPS 2019 Unsupervised Learning of Object Structure and Dynamics from Videos Matthias Minderer, Chen Sun, Ruben Villegas, Forrester Cole, Kevin P. Murphy, Honglak Lee

ECCV 2018 Actor-Centric Relation Network Chen Sun, Abhinav Shrivastava, Carl Vondrick, Kevin Murphy, Rahul Sukthankar, Cordelia Schmid

ECCV 2018 Rethinking Spatiotemporal Feature Learning: Speed-Accuracy Trade-Offs in Video Classification Saining Xie, Chen Sun, Jonathan Huang, Zhuowen Tu, Kevin Murphy

WACV 2017 Complex Event Recognition from Images with Few Training Examples Unaiza Ahsan, Chen Sun, James Hays, Irfan A. Essa

AAAI 2017 DECK: Discovering Event Composition Knowledge from Web Images for Zero-Shot Event Detection and Recounting in Videos Chuang Gan, Chen Sun, Ram Nevatia

IJCAI 2017 Instance-Level Label Propagation with Multi-Instance Learning Qifan Wang, Gal Chechik, Chen Sun, Bin Shen

ICCV 2017 Revisiting Unreasonable Effectiveness of Data in Deep Learning Era Chen Sun, Abhinav Shrivastava, Saurabh Singh, Abhinav Gupta

CVPR 2017 Speed/Accuracy Trade-Offs for Modern Convolutional Object Detectors Jonathan Huang, Vivek Rathod, Chen Sun, Menglong Zhu, Anoop Korattikara, Alireza Fathi, Ian Fischer, Zbigniew Wojna, Yang Song, Sergio Guadarrama, Kevin Murphy

ICCV 2017 TALL: Temporal Activity Localization via Language Query Jiyang Gao, Chen Sun, Zhenheng Yang, Ram Nevatia

ICCV 2017 TURN TAP: Temporal Unit Regression Network for Temporal Action Proposals Jiyang Gao, Zhenheng Yang, Kan Chen, Chen Sun, Ram Nevatia

ICCV 2017 VQS: Linking Segmentations to Questions and Answers for Supervised Attention in VQA and Question-Focused Semantic Segmentation Chuang Gan, Yandong Li, Haoxiang Li, Chen Sun, Boqing Gong

CVPR 2016 ProNet: Learning to Propose Object-Specific Boxes for Cascaded Neural Networks Chen Sun, Manohar Paluri, Ronan Collobert, Ram Nevatia, Lubomir Bourdev

ECCV 2016 Webly-Supervised Video Recognition by Mutually Voting for Relevant Web Images and Web Video Frames Chuang Gan, Chen Sun, Lixin Duan, Boqing Gong

ICCV 2015 Automatic Concept Discovery from Parallel Text and Visual Corpora Chen Sun, Chuang Gan, Ram Nevatia

CVPR 2014 DISCOVER: Discovering Important Segments for Classification of Video Events and Recounting Chen Sun, Ram Nevatia

ECCV 2014 Semantic Aware Video Transcription Using Random Forest Classifiers Chen Sun, Ram Nevatia

ICCV 2013 ACTIVE: Activity Concept Transitions in Video Event Classification Chen Sun, Ram Nevatia

WACV 2013 Large-Scale Web Video Event Classification by Use of Fisher Vectors Chen Sun, Ram Nevatia