Gan, Chuang

152 publications

CVPR 2025 3D-Mem: 3D Scene Memory for Embodied Exploration and Reasoning Yuncong Yang, Han Yang, Jiachen Zhou, Peihao Chen, Hongxin Zhang, Yilun Du, Chuang Gan

ICML 2025 ABNet: Adaptive Explicit-Barrier Net for Safe and Scalable Robot Learning Wei Xiao, Tsun-Hsuan Wang, Chuang Gan, Daniela Rus

ICML 2025 AdaWorld: Learning Adaptable World Models with Latent Actions Shenyuan Gao, Siyuan Zhou, Yilun Du, Jun Zhang, Chuang Gan

CoRL 2025 Articulate AnyMesh: Open-Vocabulary 3D Articulated Objects Modeling Xiaowen Qiu, Jincheng Yang, Yian Wang, Zhehuan Chen, Yufei Wang, Tsun-Hsuan Wang, Zhou Xian, Chuang Gan

ICLR 2025 COMBO: Compositional World Models for Embodied Multi-Agent Cooperation Hongxin Zhang, Zeyuan Wang, Qiushi Lyu, Zheyuan Zhang, Sunli Chen, Tianmin Shu, Behzad Dariush, Kwonjoon Lee, Yilun Du, Chuang Gan

ICML 2025 CommVQ: Commutative Vector Quantization for KV Cache Compression Junyan Li, Yang Zhang, Muhammad Yusuf Hassan, Talha Chafekar, Tianle Cai, Zhile Ren, Pengsheng Guo, Foroozan Karimzadeh, Colorado Reed, Chong Wang, Chuang Gan

ICLR 2025 Delta: Dense Efficient Long-Range 3D Tracking for Any Video Tuan Duc Ngo, Peiye Zhuang, Evangelos Kalogerakis, Chuang Gan, Sergey Tulyakov, Hsin-Ying Lee, Chaoyang Wang

CVPR 2025 LSceneLLM: Enhancing Large 3D Scene Understanding Using Adaptive Visual Preferences Hongyan Zhi, Peihao Chen, Junyan Li, Shuailei Ma, Xinyu Sun, Tianhang Xiang, Yinjie Lei, Mingkui Tan, Chuang Gan

NeurIPS 2025 LangSplatV2: High-Dimensional 3D Language Gaussian Splatting with 450+ FPS Wanhua Li, Yujie Zhao, Minghan Qin, Yang Liu, Yuanhao Cai, Chuang Gan, Hanspeter Pfister

NeurIPS 2025 Learning 3D Persistent Embodied World Models Siyuan Zhou, Yilun Du, Yuncong Yang, Lei Han, Peihao Chen, Dit-Yan Yeung, Chuang Gan

ICCV 2025 Learning 4D Embodied World Models Haoyu Zhen, Qiao Sun, Hongxin Zhang, Junyan Li, Siyuan Zhou, Yilun Du, Chuang Gan

NeurIPS 2025 MindJourney: Test-Time Scaling with World Models for Spatial Reasoning Yuncong Yang, Jiageng Liu, Zheyuan Zhang, Siyuan Zhou, Reuben Tan, Jianwei Yang, Yilun Du, Chuang Gan

ICCV 2025 RapVerse: Coherent Vocals and Whole-Body Motion Generation from Text Jiaben Chen, Xin Yan, Yihang Chen, Siyuan Cen, Zixin Wang, Qinwei Ma, Haoyu Zhen, Kaizhi Qian, Lie Lu, Chuang Gan

NeurIPS 2025 RobotSmith: Generative Robotic Tool Design for Acquisition of Complex Manipulation Skills Chunru Lin, Haotian Yuan, Yian Wang, Xiaowen Qiu, Tsun-Hsuan Wang, Minghao Guo, Bohan Wang, Yashraj Narang, Dieter Fox, Chuang Gan

ICLR 2025 SafeDiffuser: Safe Planning with Diffusion Probabilistic Models Wei Xiao, Tsun-Hsuan Wang, Chuang Gan, Ramin Hasani, Mathias Lechner, Daniela Rus

ICML 2025 Satori: Reinforcement Learning with Chain-of-Action-Thought Enhances LLM Reasoning via Autoregressive Search Maohao Shen, Guangtao Zeng, Zhenting Qi, Zhang-Wei Hong, Zhenfang Chen, Wei Lu, Gregory W. Wornell, Subhro Das, David Daniel Cox, Chuang Gan

ICLR 2025 Scaling Autonomous Agents via Automatic Reward Modeling and Planning Zhenfang Chen, Delin Chen, Rui Sun, Wenjun Liu, Chuang Gan

NeurIPS 2025 TalkCuts: A Large-Scale Dataset for Multi-Shot Human Speech Video Generation Jiaben Chen, Zixin Wang, Ailing Zeng, Yang Fu, Xueyang Yu, Siyuan Cen, Julian Tanke, Yihang Chen, Koichi Saito, Yuki Mitsufuji, Chuang Gan

ICLR 2025 TopoGaussian: Inferring Internal Topology Structures from Visual Clues Xiaoyu Xiong, Changyu Hu, Chunru Lin, Pingchuan Ma, Chuang Gan, Tao Du

NeurIPS 2025 Towards Understanding Camera Motions in Any Video Zhiqiu Lin, Siyuan Cen, Daniel Jiang, Jay Karhade, Hewei Wang, Chancharik Mitra, Yu Tong Tiffany Ling, Yuhan Huang, Rushikesh Zawar, Xue Bai, Yilun Du, Chuang Gan, Deva Ramanan

AAAI 2025 UniMuMo: Unified Text, Music, and Motion Generation Han Yang, Kun Su, Yutong Zhang, Jiaben Chen, Kaizhi Qian, Gaowen Liu, Chuang Gan

ICCV 2025 VCA: Video Curious Agent for Long Video Understanding Zeyuan Yang, Delin Chen, Xueyang Yu, Maohao Shen, Chuang Gan

ICML 2024 3D-VLA: A 3D Vision-Language-Action Generative World Model Haoyu Zhen, Xiaowen Qiu, Peihao Chen, Jincheng Yang, Xin Yan, Yilun Du, Yining Hong, Chuang Gan

NeurIPS 2024 Architect: Generating Vivid and Interactive 3D Scenes with Hierarchical 2D Inpainting Yian Wang, Xiaowen Qiu, Jiageng Liu, Zhehuan Chen, Jiting Cai, Yufei Wang, Tsun-Hsuan Wang, Zhou Xian, Chuang Gan

ICLR 2024 Building Cooperative Embodied Agents Modularly with Large Language Models Hongxin Zhang, Weihua Du, Jiaming Shan, Qinhong Zhou, Yilun Du, Joshua B. Tenenbaum, Tianmin Shu, Chuang Gan

ICLR 2024 CoVLM: Composing Visual Entities and Relationships in Large Language Models via Communicative Decoding Junyan Li, Delin Chen, Yining Hong, Zhenfang Chen, Peihao Chen, Yikang Shen, Chuang Gan

NeurIPS 2024 ConMe: Rethinking Evaluation of Compositional Reasoning for Modern VLMs Irene Huang, Wei Lin, M. Jehanzeb Mirza, Jacob A. Hansen, Sivan Doveh, Victor Ion Butoi, Roei Herzig, Assaf Arbelle, Hilde Kuehne, Trevor Darrell, Chuang Gan, Aude Oliva, Rogerio Feris, Leonid Karlinsky

NeurIPS 2024 Constrained Human-AI Cooperation: An Inclusive Embodied Social Intelligence Challenge Weihua Du, Qiushi Lyu, Jiaming Shan, Zhenting Qi, Hongxin Zhang, Sunli Chen, Andi Peng, Tianmin Shu, Kwonjoon Lee, Behzad Dariush, Chuang Gan

ICML 2024 ContPhy: Continuum Physical Concept Learning and Reasoning from Videos Zhicheng Zheng, Xin Yan, Zhenfang Chen, Jingzhou Wang, Qin Zhi Eddie Lim, Joshua B. Tenenbaum, Chuang Gan

ICLR 2024 DIFFTACTILE: A Physics-Based Differentiable Tactile Simulator for Contact-Rich Robotic Manipulation Zilin Si, Gu Zhang, Qingwei Ben, Branden Romero, Zhou Xian, Chao Liu, Chuang Gan

NeurIPS 2024 Easy-to-Hard Generalization: Scalable Alignment Beyond Human Supervision Zhiqing Sun, Longhui Yu, Yikang Shen, Weiyang Liu, Yiming Yang, Sean Welleck, Chuang Gan

ECCV 2024 FlexAttention for Efficient High-Resolution Vision-Language Models Junyan Li, Delin Chen, Tianle Cai, Peihao Chen, Yining Hong, Zhenfang Chen, Yikang Shen, Chuang Gan

ICLR 2024 GENOME: Generative Neuro-Symbolic Visual Reasoning by Growing and Reusing Modules Zhenfang Chen, Rui Sun, Wenjun Liu, Yining Hong, Chuang Gan

ICLR 2024 HAZARD Challenge: Embodied Decision Making in Dynamically Changing Environments Qinhong Zhou, Sunli Chen, Yisong Wang, Haozhe Xu, Weihua Du, Hongxin Zhang, Yilun Du, Joshua B. Tenenbaum, Chuang Gan

ICML 2024 LLM and Simulation as Bilevel Optimizers: A New Paradigm to Advance Physical Scientific Discovery Pingchuan Ma, Tsun-Hsuan Wang, Minghao Guo, Zhiqing Sun, Joshua B. Tenenbaum, Daniela Rus, Chuang Gan, Wojciech Matusik

NeurIPSW 2024 LLM and Simulation as Bilevel Optimizers: A New Paradigm to Advance Physical Scientific Discovery Pingchuan Ma, Tsun-Hsuan Wang, Minghao Guo, Zhiqing Sun, Joshua B. Tenenbaum, Daniela Rus, Chuang Gan, Wojciech Matusik

CVPR 2024 MultiPLY: A Multisensory Object-Centric Embodied Large Language Model in 3D World Yining Hong, Zishuo Zheng, Peihao Chen, Yian Wang, Junyan Li, Chuang Gan

CVPR 2024 Open3DIS: Open-Vocabulary 3D Instance Segmentation with 2D Mask Guidance Phuc Nguyen, Tuan Duc Ngo, Evangelos Kalogerakis, Chuang Gan, Anh Tran, Cuong Pham, Khoi Nguyen

NeurIPS 2024 Physically Compatible 3D Object Modeling from a Single Image Minghao Guo, Bohan Wang, Pingchuan Ma, Tianyuan Zhang, Crystal Elaine Owens, Chuang Gan, Joshua B. Tenenbaum, Kaiming He, Wojciech Matusik

CVPR 2024 RILA: Reflective and Imaginative Language Agent for Zero-Shot Semantic Audio-Visual Navigation Zeyuan Yang, Jiageng Liu, Peihao Chen, Anoop Cherian, Tim K. Marks, Jonathan Le Roux, Chuang Gan

ICML 2024 RoboDreamer: Learning Compositional World Models for Robot Imagination Siyuan Zhou, Yilun Du, Jiaben Chen, Yandong Li, Dit-Yan Yeung, Chuang Gan

ICML 2024 RoboGen: Towards Unleashing Infinite Data for Automated Robot Learning via Generative Simulation Yufei Wang, Zhou Xian, Feng Chen, Tsun-Hsuan Wang, Yian Wang, Katerina Fragkiadaki, Zackory Erickson, David Held, Chuang Gan

ICLR 2024 SALMON: Self-Alignment with Instructable Reward Models Zhiqing Sun, Yikang Shen, Hongxin Zhang, Qinhong Zhou, Zhenfang Chen, David Daniel Cox, Yiming Yang, Chuang Gan

CVPR 2024 SOK-Bench: A Situated Video Reasoning Benchmark with Aligned Open-World Knowledge Andong Wang, Bo Wu, Sunli Chen, Zhenfang Chen, Haotian Guan, Wei-Ning Lee, Li Erran Li, Chuang Gan

NeurIPS 2024 SocialGPT: Prompting LLMs for Social Relation Reasoning via Greedy Segment Optimization Wanhua Li, Zibin Meng, Jiawei Zhou, Donglai Wei, Chuang Gan, Hanspeter Pfister

ICML 2024 Speech Self-Supervised Learning Using Diffusion Model Synthetic Data Heting Gao, Kaizhi Qian, Junrui Ni, Chuang Gan, Mark A. Hasegawa-Johnson, Shiyu Chang, Yang Zhang

ICLR 2024 Thin-Shell Object Manipulations with Differentiable Physics Simulations Yian Wang, Juntian Zheng, Zhehuan Chen, Zhou Xian, Gu Zhang, Chao Liu, Chuang Gan

CoRL 2024 UBSoft: A Simulation Platform for Robotic Skill Learning in Unbounded Soft Environments Chunru Lin, Jugang Fan, Yian Wang, Zeyuan Yang, Zhehuan Chen, Lixing Fang, Tsun-Hsuan Wang, Zhou Xian, Chuang Gan

AAAI 2024 Visual Chain-of-Thought Prompting for Knowledge-Based Visual Reasoning Zhenfang Chen, Qinhong Zhou, Yikang Shen, Yining Hong, Zhiqing Sun, Dan Gutfreund, Chuang Gan

CVPR 2023 3D Concept Learning and Reasoning from Multi-View Images Yining Hong, Chunru Lin, Yilun Du, Zhenfang Chen, Joshua B. Tenenbaum, Chuang Gan

NeurIPS 2023 3D-LLM: Injecting the 3D World into Large Language Models Yining Hong, Haoyu Zhen, Peihao Chen, Shuhong Zheng, Yilun Du, Zhenfang Chen, Chuang Gan

NeurIPS 2023 Adaptive Online Replanning with Diffusion Models Siyuan Zhou, Yilun Du, Shun Zhang, Mengdi Xu, Yikang Shen, Wei Xiao, Dit-Yan Yeung, Chuang Gan

NeurIPSW 2023 Building Cooperative Embodied Agents Modularly with Large Language Models Hongxin Zhang, Weihua Du, Jiaming Shan, Qinhong Zhou, Yilun Du, Joshua Tenenbaum, Tianmin Shu, Chuang Gan

ICLR 2023 DexDeform: Dexterous Deformable Object Manipulation with Human Demonstrations and Differentiable Physics Sizhe Li, Zhiao Huang, Tao Chen, Tao Du, Hao Su, Joshua B. Tenenbaum, Chuang Gan

NeurIPS 2023 DiffVL: Scaling up Soft Body Manipulation Using Vision-Language Driven Differentiable Physics Zhiao Huang, Feng Chen, Yewen Pu, Chunru Lin, Hao Su, Chuang Gan

NeurIPS 2023 DiffuseBot: Breeding Soft Robots with Physics-Augmented Generative Diffusion Models Tsun-Hsuan Johnson Wang, Juntian Zheng, Pingchuan Ma, Yilun Du, Byungchul Kim, Andrew Spielberg, Josh Tenenbaum, Chuang Gan, Daniela Rus

CVPR 2023 EC2: Emergent Communication for Embodied Control Yao Mu, Shunyu Yao, Mingyu Ding, Ping Luo, Chuang Gan

ICCV 2023 EfficientViT: Lightweight Multi-Scale Attention for High-Resolution Dense Prediction Han Cai, Junyan Li, Muyan Hu, Chuang Gan, Song Han

ICLR 2023 FluidLab: A Differentiable Environment for Benchmarking Complex Fluid Manipulation Zhou Xian, Bo Zhu, Zhenjia Xu, Hsiao-Yu Tung, Antonio Torralba, Katerina Fragkiadaki, Chuang Gan

ICLR 2023 Hyper-Decision Transformer for Efficient Online Policy Adaptation Mengdi Xu, Yuchen Lu, Yikang Shen, Shun Zhang, Ding Zhao, Chuang Gan

ICML 2023 Learning Neural Constitutive Laws from Motion Observations for Generalizable PDE Dynamics Pingchuan Ma, Peter Yichen Chen, Bolei Deng, Joshua B. Tenenbaum, Tao Du, Chuang Gan, Wojciech Matusik

CVPR 2023 Learning Situation Hyper-Graphs for Video Question Answering Aisha Urooj, Hilde Kuehne, Bo Wu, Kim Chheu, Walid Bousselham, Chuang Gan, Niels Lobo, Mubarak Shah

ICCV 2023 Learning Vision-and-Language Navigation from YouTube Videos Kunyang Lin, Peihao Chen, Diwei Huang, Thomas H. Li, Mingkui Tan, Chuang Gan

CVPR 2023 Masked Motion Encoding for Self-Supervised Video Representation Learning Xinyu Sun, Peihao Chen, Liangwei Chen, Changhao Li, Thomas H. Li, Mingkui Tan, Chuang Gan

CVPR 2023 Mod-SQuAD: Designing Mixtures of Experts as Modular Multi-Task Learners Zitian Chen, Yikang Shen, Mingyu Ding, Zhenfang Chen, Hengshuang Zhao, Erik G. Learned-Miller, Chuang Gan

ICML 2023 On the Forward Invariance of Neural ODEs Wei Xiao, Tsun-Hsuan Wang, Ramin Hasani, Mathias Lechner, Yutong Ban, Chuang Gan, Daniela Rus

ICLR 2023 PAC-NeRF: Physics Augmented Continuum Neural Radiance Fields for Geometry-Agnostic System Identification Xuan Li, Yi-Ling Qiao, Peter Yichen Chen, Krishna Murthy Jatavallabhula, Ming Lin, Chenfanfu Jiang, Chuang Gan

CVPR 2023 Physics-Driven Diffusion Models for Impact Sound Synthesis from Videos Kun Su, Kaizhi Qian, Eli Shlizerman, Antonio Torralba, Chuang Gan

NeurIPS 2023 Physion++: Evaluating Physical Scene Understanding That Requires Online Inference of Different Physical Properties Hsiao-Yu Tung, Mingyu Ding, Zhenfang Chen, Daniel Bear, Chuang Gan, Josh Tenenbaum, Dan Yamins, Judith Fan, Kevin Smith

ICLR 2023 Planning with Large Language Models for Code Generation Shun Zhang, Zhenfang Chen, Yikang Shen, Mingyu Ding, Joshua B. Tenenbaum, Chuang Gan

NeurIPS 2023 Principle-Driven Self-Alignment of Language Models from Scratch with Minimal Human Supervision Zhiqing Sun, Yikang Shen, Qinhong Zhou, Hongxin Zhang, Zhenfang Chen, David Cox, Yiming Yang, Chuang Gan

ICML 2023 Reparameterized Policy Learning for Multimodal Trajectory Optimization Zhiao Huang, Litian Liang, Zhan Ling, Xuanlin Li, Chuang Gan, Hao Su

ICLR 2023 SoftZoo: A Soft Robot Co-Design Benchmark for Locomotion in Diverse Environments Tsun-Hsuan Wang, Pingchuan Ma, Andrew Everett Spielberg, Zhou Xian, Hao Zhang, Joshua B. Tenenbaum, Daniela Rus, Chuang Gan

ICCV 2023 TextPSG: Panoptic Scene Graph Generation from Textual Descriptions Chengyang Zhao, Yikang Shen, Zhenfang Chen, Mingyu Ding, Chuang Gan

CVPR 2023 Visual Dependency Transformers: Dependency Tree Emerges from Reversed Attention Mingyu Ding, Yikang Shen, Lijie Fan, Zhenfang Chen, Zitian Chen, Ping Luo, Joshua B. Tenenbaum, Chuang Gan

NeurIPS 2022 3D Concept Grounding on Neural Fields Yining Hong, Yilun Du, Chunru Lin, Josh Tenenbaum, Chuang Gan

CVPR 2022 AutoGPart: Intermediate Supervision Search for Generalizable 3D Part Segmentation Xueyi Liu, Xiaomeng Xu, Anyi Rao, Chuang Gan, Li Yi

ICLR 2022 ComPhy: Compositional Physical Reasoning of Objects and Events from Videos Zhenfang Chen, Kexin Yi, Yunzhu Li, Mingyu Ding, Antonio Torralba, Joshua B. Tenenbaum, Chuang Gan

ICLR 2022 Contact Points Discovery for Soft-Body Manipulations with Differentiable Physics Sizhe Li, Zhiao Huang, Tao Du, Hao Su, Joshua B. Tenenbaum, Chuang Gan

ICLR 2022 DiffSkill: Skill Abstraction from Differentiable Physics for Deformable Object Manipulations with Tools Xingyu Lin, Zhiao Huang, Yunzhu Li, Joshua B. Tenenbaum, David Held, Chuang Gan

CoRL 2022 Embodied Concept Learner: Self-Supervised Learning of Concepts and Mapping Through Instruction Following Mingyu Ding, Yan Xu, Zhenfang Chen, David Daniel Cox, Ping Luo, Joshua B. Tenenbaum, Chuang Gan

ICLR 2022 FALCON: Fast Visual Concept Learning by Integrating Images, Linguistic Descriptions, and Conceptual Relations Lingjie Mei, Jiayuan Mao, Ziqi Wang, Chuang Gan, Joshua B. Tenenbaum

CVPR 2022 Finding Fallen Objects via Asynchronous Audio-Visual Integration Chuang Gan, Yi Gu, Siyuan Zhou, Jeremy Schwartz, Seth Alter, James Traer, Dan Gutfreund, Joshua B. Tenenbaum, Josh H. McDermott, Antonio Torralba

CVPR 2022 Fixing Malfunctional Objects with Learned Physical Simulation and Functional Prediction Yining Hong, Kaichun Mo, Li Yi, Leonidas J. Guibas, Antonio Torralba, Joshua B. Tenenbaum, Chuang Gan

NeurIPSW 2022 Hyper-Decision Transformer for Efficient Online Policy Adaptation Mengdi Xu, Yuchen Lu, Yikang Shen, Shun Zhang, Ding Zhao, Chuang Gan

NeurIPS 2022 Learning Active Camera for Multi-Object Navigation Peihao Chen, Dongyu Ji, Kunyang Lin, Weiwen Hu, Wenbing Huang, Thomas Li, Mingkui Tan, Chuang Gan

NeurIPS 2022 Learning Neural Acoustic Fields Andrew Luo, Yilun Du, Michael Tarr, Josh Tenenbaum, Antonio Torralba, Chuang Gan

NeurIPS 2022 Learning Physical Dynamics with Subequivariant Graph Neural Networks Jiaqi Han, Wenbing Huang, Hengbo Ma, Jiachen Li, Josh Tenenbaum, Chuang Gan

ICLR 2022 Linking Emergent and Natural Languages via Corpus Transfer Shunyu Yao, Mo Yu, Yang Zhang, Karthik R Narasimhan, Joshua B. Tenenbaum, Chuang Gan

ICLR 2022 Network Augmentation for Tiny Deep Learning Han Cai, Chuang Gan, Ji Lin, Song Han

NeurIPS 2022 On-Device Training Under 256KB Memory Ji Lin, Ligeng Zhu, Wei-Ming Chen, Wei-Chen Wang, Chuang Gan, Song Han

NeurIPSW 2022 Planning with Large Language Models for Code Generation Shun Zhang, Zhenfang Chen, Yikang Shen, Mingyu Ding, Joshua B. Tenenbaum, Chuang Gan

CoRL 2022 Planning with Spatial-Temporal Abstraction from Point Clouds for Deformable Object Manipulation Xingyu Lin, Carl Qi, Yunchu Zhang, Zhiao Huang, Katerina Fragkiadaki, Yunzhu Li, Chuang Gan, David Held

ICML 2022 Prompting Decision Transformer for Few-Shot Policy Generalization Mengdi Xu, Yikang Shen, Shun Zhang, Yuchen Lu, Ding Zhao, Joshua Tenenbaum, Chuang Gan

ECCV 2022 Prototype-Guided Continual Adaptation for Class-Incremental Unsupervised Domain Adaptation Hongbin Lin, Yifan Zhang, Zhen Qiu, Shuaicheng Niu, Chuang Gan, Yanxia Liu, Mingkui Tan

ICLR 2022 RISP: Rendering-Invariant State Predictor with Differentiable Simulation and Rendering for Cross-Domain Parameter Estimation Pingchuan Ma, Tao Du, Joshua B. Tenenbaum, Wojciech Matusik, Chuang Gan

NeurIPS 2022 SNAKE: Shape-Aware Neural 3D Keypoint Field Chengliang Zhong, Peixing You, Xiaoxue Chen, Hao Zhao, Fuchun Sun, Guyue Zhou, Xiaodong Mu, Chuang Gan, Wenbing Huang

NeurIPSW 2022 Variational Reparametrized Policy Learning with Differentiable Physics Zhiao Huang, Litian Liang, Zhan Ling, Xuanlin Li, Chuang Gan, Hao Su

ECCV 2022 Weakly Supervised Grounding for VQA in Vision-Language Transformers Aisha Urooj, Hilde Kuehne, Chuang Gan, Niels Da Vitoria Lobo, Mubarak Shah

NeurIPS 2022 Weakly-Supervised Multi-Granularity mAP Learning for Vision-and-Language Navigation Peihao Chen, Dongyu Ji, Kunyang Lin, Runhao Zeng, Thomas Li, Mingkui Tan, Chuang Gan

ICML 2021 AGENT: A Benchmark for Core Psychological Reasoning Tianmin Shu, Abhishek Bhandwaldar, Chuang Gan, Kevin Smith, Shari Liu, Dan Gutfreund, Elizabeth Spelke, Joshua Tenenbaum, Tomer Ullman

ICML 2021 Adversarial Option-Aware Hierarchical Imitation Learning Mingxuan Jing, Wenbing Huang, Fuchun Sun, Xiaojian Ma, Tao Kong, Chuang Gan, Lei Li

AAAI 2021 Augmenting Policy Learning with Routines Discovered from a Single Demonstration Zelin Zhao, Chuang Gan, Jiajun Wu, Xiaoxiao Guo, Joshua B. Tenenbaum

ICCV 2021 Curious Representation Learning for Embodied Intelligence Yilun Du, Chuang Gan, Phillip Isola

NeurIPS 2021 Dynamic Visual Reasoning by Learning Differentiable Physics Models from Video and Language Mingyu Ding, Zhenfang Chen, Tao Du, Ping Luo, Josh Tenenbaum, Chuang Gan

CVPR 2021 Found a Reason for Me? Weakly-Supervised Grounded Visual Question Answering Using Capsules Aisha Urooj, Hilde Kuehne, Kevin Duarte, Chuang Gan, Niels Lobo, Mubarak Shah

ICML 2021 Global Prosody Style Transfer Without Text Transcriptions Kaizhi Qian, Yang Zhang, Shiyu Chang, Jinjun Xiong, Chuang Gan, David Cox, Mark Hasegawa-Johnson

ICLR 2021 Grounding Physical Concepts of Objects and Events Through Dynamic Visual Reasoning Zhenfang Chen, Jiayuan Mao, Jiajun Wu, Kwan-Yee Kenneth Wong, Joshua B. Tenenbaum, Chuang Gan

ICLR 2021 Learning Task Decomposition with Ordered Memory Policy Network Yuchen Lu, Yikang Shen, Siyuan Zhou, Aaron Courville, Joshua B. Tenenbaum, Chuang Gan

AAAI 2021 MVFNet: Multi-View Fusion Network for Efficient Video Recognition Wenhao Wu, Dongliang He, Tianwei Lin, Fu Li, Chuang Gan, Errui Ding

NeurIPS 2021 Memory-Efficient Patch-Based Inference for Tiny Deep Learning Ji Lin, Wei-Ming Chen, Han Cai, Chuang Gan, Song Han

ICLR 2021 On Fast Adversarial Robustness Adaptation in Model-Agnostic Meta-Learning Ren Wang, Kaidi Xu, Sijia Liu, Pin-Yu Chen, Tsui-Wei Weng, Chuang Gan, Meng Wang

NeurIPS 2021 PTR: A Benchmark for Part-Based Conceptual, Relational, and Physical Reasoning Yining Hong, Li Yi, Josh Tenenbaum, Antonio Torralba, Chuang Gan

ICLR 2021 PlasticineLab: A Soft-Body Manipulation Benchmark with Differentiable Physics Zhiao Huang, Yuanming Hu, Tao Du, Siyuan Zhou, Hao Su, Joshua B. Tenenbaum, Chuang Gan

AAAI 2021 RSPNet: Relative Speed Perception for Unsupervised Video Representation Learning Peihao Chen, Deng Huang, Dongliang He, Xiang Long, Runhao Zeng, Shilei Wen, Mingkui Tan, Chuang Gan

IJCAI 2021 Temporal and Object Quantification Networks Jiayuan Mao, Zhezheng Luo, Chuang Gan, Joshua B. Tenenbaum, Jiajun Wu, Leslie Pack Kaelbling, Tomer D. Ullman

NeurIPS 2021 When Does Contrastive Learning Preserve Adversarial Robustness from Pretraining to Finetuning? Lijie Fan, Sijia Liu, Pin-Yu Chen, Gaoyuan Zhang, Chuang Gan

ICLR 2020 CLEVRER: CoLlision Events for Video REpresentation and Reasoning Kexin Yi, Chuang Gan, Yunzhu Li, Pushmeet Kohli, Jiajun Wu, Antonio Torralba, Joshua B. Tenenbaum

ECCV 2020 DataMix: Efficient Privacy-Preserving Edge-Cloud Inference Zhijian Liu, Zhanghao Wu, Chuang Gan, Ligeng Zhu, Song Han

ICLR 2020 Deep Audio Priors Emerge from Harmonic Convolutional Networks Zhoutong Zhang, Yunyun Wang, Chuang Gan, Jiajun Wu, Joshua B. Tenenbaum, Antonio Torralba, William T. Freeman

ECCV 2020 Foley Music: Learning to Generate Music from Videos Chuang Gan, Deng Huang, Peihao Chen, Joshua B. Tenenbaum, Antonio Torralba

AAAI 2020 Location-Aware Graph Convolutional Networks for Video Question Answering Deng Huang, Peihao Chen, Runhao Zeng, Qing Du, Mingkui Tan, Chuang Gan

NeurIPS 2020 MCUNet: Tiny Deep Learning on IoT Devices Ji Lin, Wei-Ming Chen, Yujun Lin, John Cohn, Chuang Gan, Song Han

ICLR 2020 Once for All: Train One Network and Specialize It for Efficient Deployment Han Cai, Chuang Gan, Tianzhe Wang, Zhekai Zhang, Song Han

NeurIPS 2020 TinyTL: Reduce Memory, Not Parameters for Efficient On-Device Learning Han Cai, Chuang Gan, Ligeng Zhu, Song Han

AAAI 2019 Beyond RNNs: Positional Self-Attention with Co-Attention for Video Question Answering Xiangpeng Li, Jingkuan Song, Lianli Gao, Xianglong Liu, Wenbing Huang, Xiangnan He, Chuang Gan

AAAI 2019 Controllable Image-to-Video Translation: A Case Study on Facial Expression Generation Lijie Fan, Wenbing Huang, Chuang Gan, Junzhou Huang, Boqing Gong

NeurIPS 2019 Cross-Channel Communication Networks Jianwei Yang, Zhile Ren, Chuang Gan, Hongyuan Zhu, Devi Parikh

ICLR 2019 Defensive Quantization: When Efficiency Meets Robustness Ji Lin, Chuang Gan, Song Han

NeurIPS 2019 Imitation Learning from Observations by Minimizing Inverse Dynamics Disagreement Chao Yang, Xiaojian Ma, Wenbing Huang, Fuchun Sun, Huaping Liu, Junzhou Huang, Chuang Gan

CVPRW 2019 Self-Supervised Segmentation and Source Separation on Videos Andrew Rouditchenko, Hang Zhao, Chuang Gan, Josh H. McDermott, Antonio Torralba

AAAI 2019 StNet: Local and Global Spatial-Temporal Modeling for Action Recognition Dongliang He, Zhichao Zhou, Chuang Gan, Fu Li, Xiao Liu, Yandong Li, Limin Wang, Shilei Wen

ICLR 2019 The Neuro-Symbolic Concept Learner: Interpreting Scenes, Words, and Sentences from Natural Supervision Jiayuan Mao, Chuang Gan, Pushmeet Kohli, Joshua B. Tenenbaum, Jiajun Wu

NeurIPS 2019 Visual Concept-Metaconcept Learning Chi Han, Jiayuan Mao, Chuang Gan, Josh Tenenbaum, Jiajun Wu

AAAI 2018 Multimodal Keyless Attention Fusion for Video Classification Xiang Long, Chuang Gan, Gerard de Melo, Xiao Liu, Yandong Li, Fu Li, Shilei Wen

NeurIPS 2018 Neural-Symbolic VQA: Disentangling Reasoning from Vision and Language Understanding Kexin Yi, Jiajun Wu, Chuang Gan, Antonio Torralba, Pushmeet Kohli, Josh Tenenbaum

AAAI 2018 T-C3D: Temporal Convolutional 3D Network for Real-Time Action Recognition Kun Liu, Wu Liu, Chuang Gan, Mingkui Tan, Huadong Ma

ECCV 2018 The Sound of Pixels Hang Zhao, Chuang Gan, Andrew Rouditchenko, Carl Vondrick, Josh McDermott, Antonio Torralba

ECCV 2018 Unsupervised Domain Adaptation for 3D Keypoint Estimation via View Consistency Xingyi Zhou, Arjun Karpur, Chuang Gan, Linjie Luo, Qixing Huang

NeurIPS 2018 Weakly Supervised Dense Event Captioning in Videos Xuguang Duan, Wenbing Huang, Chuang Gan, Jingdong Wang, Wenwu Zhu, Junzhou Huang

AAAI 2017 DECK: Discovering Event Composition Knowledge from Web Images for Zero-Shot Event Detection and Recounting in Videos Chuang Gan, Chen Sun, Ram Nevatia

ICCV 2017 Recurrent Topic-Transition GAN for Visual Paragraph Generation Xiaodan Liang, Zhiting Hu, Hao Zhang, Chuang Gan, Eric P. Xing

CVPR 2017 Semantic Compositional Networks for Visual Captioning Zhe Gan, Chuang Gan, Xiaodong He, Yunchen Pu, Kenneth Tran, Jianfeng Gao, Lawrence Carin, Li Deng

CVPR 2017 StyleNet: Generating Attractive Visual Captions with Styles Chuang Gan, Zhe Gan, Xiaodong He, Jianfeng Gao, Li Deng

ICCV 2017 VQS: Linking Segmentations to Questions and Answers for Supervised Attention in VQA and Question-Focused Semantic Segmentation Chuang Gan, Yandong Li, Haoxiang Li, Chen Sun, Boqing Gong

AAAI 2016 Concepts Not Alone: Exploring Pairwise Relationships for Zero-Shot Video Activity Recognition Chuang Gan, Ming C. Lin, Yi Yang, Gerard de Melo, Alexander G. Hauptmann

CVPR 2016 Learning Attributes Equals Multi-Source Domain Generalization Chuang Gan, Tianbao Yang, Boqing Gong

ECCV 2016 Webly-Supervised Video Recognition by Mutually Voting for Relevant Web Images and Web Video Frames Chuang Gan, Chen Sun, Lixin Duan, Boqing Gong

CVPR 2016 You Lead, We Exceed: Labor-Free Video Concept Learning by Jointly Exploiting Web Videos and Images Chuang Gan, Ting Yao, Kuiyuan Yang, Yi Yang, Tao Mei

ICCV 2015 Automatic Concept Discovery from Parallel Text and Visual Corpora Chen Sun, Chuang Gan, Ram Nevatia

CVPR 2015 DevNet: A Deep Event Network for Multimedia Event Detection and Evidence Recounting Chuang Gan, Naiyan Wang, Yi Yang, Dit-Yan Yeung, Alex G. Hauptmann

AAAI 2015 Exploring Semantic Inter-Class Relationships (SIR) for Zero-Shot Action Recognition Chuang Gan, Ming Lin, Yi Yang, Yueting Zhuang, Alexander G. Hauptmann