Liu, Ming-Yu

83 publications

ICLR 2026 $PhyWorldBench$: A Comprehensive Evaluation of Physical Realism in Text-to-Video Models Jing Gu, Xian Liu, Yu Zeng, Ashwin Nagarajan, Fangrui Zhu, Daniel Hong, Yue Fan, Qianqi Yan, Kaiwen Zhou, Ming-Yu Liu, Xin Eric Wang

ICLR 2026 Cosmos Policy: Fine-Tuning Video Models for Visuomotor Control and Planning Moo Jin Kim, Yihuai Gao, Tsung-Yi Lin, Yen-Chen Lin, Yunhao Ge, Grace Lam, Percy Liang, Shuran Song, Ming-Yu Liu, Chelsea Finn, Jinwei Gu

ICLR 2026 DiffusionNFT: Online Diffusion Reinforcement with Forward Process Kaiwen Zheng, Huayu Chen, Haotian Ye, Haoxiang Wang, Qinsheng Zhang, Kai Jiang, Hang Su, Stefano Ermon, Jun Zhu, Ming-Yu Liu

ICLR 2026 InfoTok: Adaptive Discrete Video Tokenizer via Information-Theoretic Compression Haotian Ye, Qiyuan He, Jiaqi Han, Puheng Li, Jiaojiao Fan, Zekun Hao, Fitsum Reda, Yogesh Balaji, Huayu Chen, Sheng Liu, Angela Yao, James Zou, Stefano Ermon, Haoxiang Wang, Ming-Yu Liu

ICLR 2026 Large Scale Diffusion Distillation via Score-Regularized Continuous-Time Consistency Kaiwen Zheng, Yuji Wang, Qianli Ma, Huayu Chen, Jintao Zhang, Yogesh Balaji, Jianfei Chen, Ming-Yu Liu, Jun Zhu, Qinsheng Zhang

ICLR 2026 NFT: Bridging Supervised Learning and Reinforcement Learning in Math Reasoning Huayu Chen, Kaiwen Zheng, Qinsheng Zhang, Ganqu Cui, Yin Cui, Haotian Ye, Tsung-Yi Lin, Ming-Yu Liu, Jun Zhu, Haoxiang Wang

ICLR 2026 Scenethesis: A Language and Vision Agentic Framework for 3D Scene Generation Lu Ling, Chen-Hsuan Lin, Tsung-Yi Lin, Yifan Ding, Yu Zeng, Yichen Sheng, Yunhao Ge, Ming-Yu Liu, Aniket Bera, Max Li

CVPR 2025 A Comprehensive Study of Decoder-Only LLMs for Text-to-Image Generation Andrew Z. Wang, Songwei Ge, Tero Karras, Ming-Yu Liu, Yogesh Balaji

CVPR 2025 ArtiScene: Language-Driven Artistic 3D Scene Generation Through Image Intermediary Zeqi Gu, Yin Cui, Zhaoshuo Li, Fangyin Wei, Yunhao Ge, Jinwei Gu, Ming-Yu Liu, Abe Davis, Yifan Ding

CVPR 2025 Articulated Kinematics Distillation from Video Diffusion Models Xuan Li, Qianli Ma, Tsung-Yi Lin, Yongxin Chen, Chenfanfu Jiang, Ming-Yu Liu, Donglai Xiang

CVPR 2025 CoT-VLA: Visual Chain-of-Thought Reasoning for Vision-Language-Action Models Qingqing Zhao, Yao Lu, Moo Jin Kim, Zipeng Fu, Zhuoyang Zhang, Yecheng Wu, Zhaoshuo Li, Qianli Ma, Song Han, Chelsea Finn, Ankur Handa, Tsung-Yi Lin, Gordon Wetzstein, Ming-Yu Liu, Donglai Xiang

ICCV 2025 Describe Anything: Detailed Localized Image and Video Captioning Long Lian, Yifan Ding, Yunhao Ge, Sifei Liu, Hanzi Mao, Boyi Li, Marco Pavone, Ming-Yu Liu, Trevor Darrell, Adam Yala, Yin Cui

ICML 2025 Direct Discriminative Optimization: Your Likelihood-Based Visual Generative Model Is Secretly a GAN Discriminator Kaiwen Zheng, Yongxin Chen, Huayu Chen, Guande He, Ming-Yu Liu, Jun Zhu, Qinsheng Zhang

CoRL 2025 DreamGen: Unlocking Generalization in Robot Learning Through Video World Models Joel Jang, Seonghyeon Ye, Zongyu Lin, Jiannan Xiang, Johan Bjorck, Yu Fang, Fengyuan Hu, Spencer Huang, Kaushil Kundalia, Yen-Chen Lin, Loïc Magne, Ajay Mandlekar, Avnish Narayan, You Liang Tan, Guanzhi Wang, Jing Wang, Qi Wang, Yinzhen Xu, Xiaohui Zeng, Kaiyuan Zheng, Ruijie Zheng, Ming-Yu Liu, Luke Zettlemoyer, Dieter Fox, Jan Kautz, Scott Reed, Yuke Zhu, Linxi Fan

CVPR 2025 Dynamic Camera Poses and Where to Find Them Chris Rockwell, Joseph Tung, Tsung-Yi Lin, Ming-Yu Liu, David F. Fouhey, Chen-Hsuan Lin

ICLR 2025 EdgeRunner: Auto-Regressive Auto-Encoder for Artistic Mesh Generation Jiaxiang Tang, Zhaoshuo Li, Zekun Hao, Xian Liu, Gang Zeng, Ming-Yu Liu, Qinsheng Zhang

NeurIPS 2025 Efficient Part-Level 3D Object Generation via Dual Volume Packing Jiaxiang Tang, Ruijie Lu, Max Li, Zekun Hao, Xuan Li, Fangyin Wei, Shuran Song, Gang Zeng, Ming-Yu Liu, Tsung-Yi Lin

CVPR 2025 HMAR: Efficient Hierarchical Masked Auto-Regressive Image Generation Hermann Kumbong, Xian Liu, Tsung-Yi Lin, Ming-Yu Liu, Xihui Liu, Ziwei Liu, Daniel Y. Fu, Christopher Re, David W. Romero

ICLR 2025 High-Quality Joint Image and Video Tokenization with Causal VAE Dawit Mureja Argaw, Xian Liu, Qinsheng Zhang, Joon Son Chung, Ming-Yu Liu, Fitsum Reda

ICLR 2025 Masked Diffusion Models Are Secretly Time-Agnostic Masked Models and Exploit Inaccurate Categorical Sampling Kaiwen Zheng, Yongxin Chen, Hanzi Mao, Ming-Yu Liu, Jun Zhu, Qinsheng Zhang

ICML 2025 One-Step Diffusion Policy: Fast Visuomotor Policies via Diffusion Distillation Zhendong Wang, Max Li, Ajay Mandlekar, Zhenjia Xu, Jiaojiao Fan, Yashraj Narang, Linxi Fan, Yuke Zhu, Yogesh Balaji, Mingyuan Zhou, Ming-Yu Liu, Yu Zeng

TMLR 2025 Wolf: Dense Video Captioning with a World Summarization Framework Boyi Li, Ligeng Zhu, Ran Tian, Shuhan Tan, Yuxiao Chen, Yao Lu, Yin Cui, Sushant Veer, Max Ehrlich, Jonah Philion, Xinshuo Weng, Fuzhao Xue, Linxi Fan, Yuke Zhu, Jan Kautz, Andrew Tao, Ming-Yu Liu, Sanja Fidler, Boris Ivanovic, Trevor Darrell, Jitendra Malik, Song Han, Marco Pavone

CVPR 2024 Condition-Aware Neural Network for Controlled Image Generation Han Cai, Muyang Li, Qinsheng Zhang, Ming-Yu Liu, Song Han

CVPR 2024 JeDi: Joint-Image Diffusion Models for Finetuning-Free Personalized Text-to-Image Generation Yu Zeng, Vishal M. Patel, Haochen Wang, Xun Huang, Ting-Chun Wang, Ming-Yu Liu, Yogesh Balaji

CVPR 2024 Visual Fact Checker: Enabling High-Fidelity Detailed Caption Generation Yunhao Ge, Xiaohui Zeng, Jacob Samuel Huffman, Tsung-Yi Lin, Ming-Yu Liu, Yin Cui

NeurIPSW 2024 Wolf: Captioning Everything with a World Summarization Framework Boyi Li, Ligeng Zhu, Ran Tian, Shuhan Tan, Yuxiao Chen, Yao Lu, Yin Cui, Sushant Veer, Max Ehrlich, Jonah Philion, Xinshuo Weng, Fuzhao Xue, Andrew Tao, Ming-Yu Liu, Sanja Fidler, Boris Ivanovic, Trevor Darrell, Jitendra Malik, Song Han, Marco Pavone

ICCV 2023 ATT3D: Amortized Text-to-3D Object Synthesis Jonathan Lorraine, Kevin Xie, Xiaohui Zeng, Chen-Hsuan Lin, Towaki Takikawa, Nicholas Sharp, Tsung-Yi Lin, Ming-Yu Liu, Sanja Fidler, James Lucas

CVPR 2023 DiffCollage: Parallel Generation of Large Content with Diffusion Models Qinsheng Zhang, Jiaming Song, Xun Huang, Yongxin Chen, Ming-Yu Liu

ICML 2023 Loss-Guided Diffusion Models for Plug-and-Play Controllable Generation Jiaming Song, Qinsheng Zhang, Hongxu Yin, Morteza Mardani, Ming-Yu Liu, Jan Kautz, Yongxin Chen, Arash Vahdat

CVPR 2023 Magic3D: High-Resolution Text-to-3D Content Creation Chen-Hsuan Lin, Jun Gao, Luming Tang, Towaki Takikawa, Xiaohui Zeng, Xun Huang, Karsten Kreis, Sanja Fidler, Ming-Yu Liu, Tsung-Yi Lin

CVPR 2023 Neuralangelo: High-Fidelity Neural Surface Reconstruction Zhaoshuo Li, Thomas Müller, Alex Evans, Russell H. Taylor, Mathias Unberath, Ming-Yu Liu, Chen-Hsuan Lin

ICCV 2023 Preserve Your Own Correlation: A Noise Prior for Video Diffusion Models Songwei Ge, Seungjun Nah, Guilin Liu, Tyler Poon, Andrew Tao, Bryan Catanzaro, David Jacobs, Jia-Bin Huang, Ming-Yu Liu, Yogesh Balaji

ICCV 2023 SPACE: Speech-Driven Portrait Animation with Controllable Expression Siddharth Gururani, Arun Mallya, Ting-Chun Wang, Rafael Valle, Ming-Yu Liu

NeurIPS 2022 Generating Long Videos of Dynamic Scenes Tim Brooks, Janne Hellsten, Miika Aittala, Ting-Chun Wang, Timo Aila, Jaakko Lehtinen, Ming-Yu Liu, Alexei Efros, Tero Karras

NeurIPS 2022 Implicit Neural Representations with Levels-of-Experts Zekun Hao, Arun Mallya, Serge Belongie, Ming-Yu Liu

NeurIPS 2022 Implicit Warping for Animation with Image Sets Arun Mallya, Ting-Chun Wang, Ming-Yu Liu

ECCV 2022 Multimodal Conditional Image Synthesis with Product-of-Experts GANs Xun Huang, Arun Mallya, Ting-Chun Wang, Ming-Yu Liu

NeurIPS 2021 Deep Marching Tetrahedra: A Hybrid Representation for High-Resolution 3D Shape Synthesis Tianchang Shen, Jun Gao, Kangxue Yin, Ming-Yu Liu, Sanja Fidler

ICCV 2021 GANcraft: Unsupervised 3D Neural Rendering of Minecraft Worlds Zekun Hao, Arun Mallya, Serge Belongie, Ming-Yu Liu

CVPR 2021 One-Shot Free-View Neural Talking-Head Synthesis for Video Conferencing Ting-Chun Wang, Arun Mallya, Ming-Yu Liu

ECCV 2020 COCO-FUNIT: Few-Shot Unsupervised Image Translation with a Content Conditioned Style Encoder Kuniaki Saito, Kate Saenko, Ming-Yu Liu

CVPR 2020 Instance-Aware, Context-Focused, and Memory-Efficient Weakly Supervised Object Detection Zhongzheng Ren, Zhiding Yu, Xiaodong Yang, Ming-Yu Liu, Yong Jae Lee, Alexander G. Schwing, Jan Kautz

NeurIPS 2020 Learning Compositional Functions via Multiplicative Weight Updates Jeremy Bernstein, Jiawei Zhao, Markus Meister, Ming-Yu Liu, Anima Anandkumar, Yisong Yue

NeurIPS 2020 On the Distance Between Two Neural Networks and the Stability of Learning Jeremy Bernstein, Arash Vahdat, Yisong Yue, Ming-Yu Liu

WACV 2020 SymGAN: Orientation Estimation Without Annotation for Symmetric Objects Phil Ammirato, Jonathan Tremblay, Ming-Yu Liu, Alexander Berg, Dieter Fox

ECCV 2020 UFO²: A Unified Framework Towards Omni-Supervised Object Detection Zhongzheng Ren, Zhiding Yu, Xiaodong Yang, Ming-Yu Liu, Alexander G. Schwing, Jan Kautz

CVPR 2020 UNAS: Differentiable Architecture Search Meets Reinforcement Learning Arash Vahdat, Arun Mallya, Ming-Yu Liu, Jan Kautz

ECCV 2020 World-Consistent Video-to-Video Synthesis Arun Mallya, Ting-Chun Wang, Karan Sapra, Ming-Yu Liu

CVPR 2019 CityFlow: A City-Scale Benchmark for Multi-Target Multi-Camera Vehicle Tracking and Re-Identification Zheng Tang, Milind Naphade, Ming-Yu Liu, Xiaodong Yang, Stan Birchfield, Shuo Wang, Ratnesh Kumar, David Anastasiu, Jenq-Neng Hwang

NeurIPS 2019 Dancing to Music Hsin-Ying Lee, Xiaodong Yang, Ming-Yu Liu, Ting-Chun Wang, Yu-Ding Lu, Ming-Hsuan Yang, Jan Kautz

ICCV 2019 Few-Shot Unsupervised Image-to-Image Translation Ming-Yu Liu, Xun Huang, Arun Mallya, Tero Karras, Timo Aila, Jaakko Lehtinen, Jan Kautz

NeurIPS 2019 Few-Shot Video-to-Video Synthesis Ting-Chun Wang, Ming-Yu Liu, Andrew Tao, Guilin Liu, Bryan Catanzaro, Jan Kautz

ICCV 2019 Meta-Sim: Learning to Generate Synthetic Datasets Amlan Kar, Aayush Prakash, Ming-Yu Liu, Eric Cameracci, Justin Yuan, Matt Rusiniak, David Acuna, Antonio Torralba, Sanja Fidler

ICCV 2019 Neural Turtle Graphics for Modeling City Road Layouts Hang Chu, Daiqing Li, David Acuna, Amlan Kar, Maria Shugrina, Xinkai Wei, Ming-Yu Liu, Antonio Torralba, Sanja Fidler

ICCV 2019 PointFlow: 3D Point Cloud Generation with Continuous Normalizing Flows Guandao Yang, Xun Huang, Zekun Hao, Ming-Yu Liu, Serge Belongie, Bharath Hariharan

CVPR 2019 STEP: Spatio-Temporal Progressive Learning for Video Action Detection Xitong Yang, Xiaodong Yang, Ming-Yu Liu, Fanyi Xiao, Larry S. Davis, Jan Kautz

CVPR 2019 Semantic Image Synthesis with Spatially-Adaptive Normalization Taesung Park, Ming-Yu Liu, Ting-Chun Wang, Jun-Yan Zhu

AAAI 2019 Unsupervised Stylish Image Description Generation via Domain Layer Norm Cheng-Kuan Chen, Zhufeng Pan, Ming-Yu Liu, Min Sun

ECCV 2018 A Closed-Form Solution to Photorealistic Image Stylization Yijun Li, Ming-Yu Liu, Xueting Li, Ming-Hsuan Yang, Jan Kautz

NeurIPS 2018 Context-Aware Synthesis and Placement of Object Instances Donghoon Lee, Sifei Liu, Jinwei Gu, Ming-Yu Liu, Ming-Hsuan Yang, Jan Kautz

CVPR 2018 High-Resolution Image Synthesis and Semantic Manipulation with Conditional GANs Ting-Chun Wang, Ming-Yu Liu, Jun-Yan Zhu, Andrew Tao, Jan Kautz, Bryan Catanzaro

AAAI 2018 Learning Binary Residual Representations for Domain-Specific Video Streaming Yi-Hsuan Tsai, Ming-Yu Liu, Deqing Sun, Ming-Hsuan Yang, Jan Kautz

CVPR 2018 Learning Superpixels with Segmentation-Aware Affinity Loss Wei-Chih Tu, Ming-Yu Liu, Varun Jampani, Deqing Sun, Shao-Yi Chien, Ming-Hsuan Yang, Jan Kautz

CVPR 2018 MoCoGAN: Decomposing Motion and Content for Video Generation Sergey Tulyakov, Ming-Yu Liu, Xiaodong Yang, Jan Kautz

ECCV 2018 Multimodal Unsupervised Image-to-Image Translation Xun Huang, Ming-Yu Liu, Serge Belongie, Jan Kautz

CVPR 2018 PWC-Net: CNNs for Optical Flow Using Pyramid, Warping, and Cost Volume Deqing Sun, Xiaodong Yang, Ming-Yu Liu, Jan Kautz

ECCV 2018 Superpixel Sampling Networks Varun Jampani, Deqing Sun, Ming-Yu Liu, Ming-Hsuan Yang, Jan Kautz

CVPRW 2018 The 2018 NVIDIA AI City Challenge Milind Naphade, Ming-Ching Chang, Anuj Sharma, David C. Anastasiu, Vamsi Jagarlamudi, Pranamesh Chakraborty, Tingting Huang, Shuo Wang, Ming-Yu Liu, Rama Chellappa, Jenq-Neng Hwang, Siwei Lyu

NeurIPS 2018 Video-to-Video Synthesis Ting-Chun Wang, Ming-Yu Liu, Jun-Yan Zhu, Guilin Liu, Andrew Tao, Jan Kautz, Bryan Catanzaro

CVPR 2017 CASENet: Deep Category-Aware Semantic Edge Detection Zhiding Yu, Chen Feng, Ming-Yu Liu, Srikumar Ramalingam

CVPR 2017 Deep 360 Pilot: Learning a Deep Agent for Piloting Through 360deg Sports Videos Hou-Ning Hu, Yen-Chen Lin, Ming-Yu Liu, Hsien-Tzu Cheng, Yung-Ju Chang, Min Sun

ICLR 2017 Tactics of Adversarial Attack on Deep Reinforcement Learning Agents Yen-Chen Lin, Zhang-Wei Hong, Yuan-Hong Liao, Meng-Li Shih, Ming-Yu Liu, Min Sun

IJCAI 2017 Tactics of Adversarial Attack on Deep Reinforcement Learning Agents Yen-Chen Lin, Zhang-Wei Hong, Yuan-Hong Liao, Meng-Li Shih, Ming-Yu Liu, Min Sun

NeurIPS 2017 Unsupervised Image-to-Image Translation Networks Ming-Yu Liu, Thomas Breuel, Jan Kautz

NeurIPS 2016 Coupled Generative Adversarial Networks Ming-Yu Liu, Oncel Tuzel

CVPR 2016 Deep Gaussian Conditional Random Field Network: A Model-Based Deep Network for Discriminative Denoising Raviteja Vemulapalli, Oncel Tuzel, Ming-Yu Liu

CVPR 2016 Gaussian Conditional Random Field Network for Semantic Segmentation Raviteja Vemulapalli, Oncel Tuzel, Ming-Yu Liu, Rama Chellapa

WACV 2016 Unsupervised Network Pretraining via Encoding Human Design Ming-Yu Liu, Arun Mallya, Oncel Tuzel, Xi Chen

ECCV 2014 Learning to Rank 3D Features Oncel Tuzel, Ming-Yu Liu, Yuichi Taguchi, Arvind Raghunathan

NeurIPS 2014 Recursive Context Propagation Network for Semantic Scene Labeling Abhishek Sharma, Oncel Tuzel, Ming-Yu Liu

CVPR 2013 Joint Geodesic Upsampling of Depth Images Ming-Yu Liu, Oncel Tuzel, Yuichi Taguchi

CVPR 2011 Entropy Rate Superpixel Segmentation Ming-Yu Liu, Oncel Tuzel, Srikumar Ramalingam, Rama Chellappa

CVPR 2010 Fast Directional Chamfer Matching Ming-Yu Liu, Oncel Tuzel, Ashok Veeraraghavan, Rama Chellappa