Xie, Saining

51 publications

ICLR 2025 AuroraCap: Efficient, Performant Video Detailed Captioning and a New Benchmark Wenhao Chai, Enxin Song, Yilun Du, Chenlin Meng, Vashisht Madhavan, Omer Bar-Tal, Jenq-Neng Hwang, Saining Xie, Christopher D Manning

ICLR 2025 Deconstructing Denoising Diffusion Models for Self-Supervised Learning Xinlei Chen, Zhuang Liu, Saining Xie, Kaiming He

ICLR 2025 DiffusionGuard: A Robust Defense Against Malicious Diffusion-Based Image Editing June Suk Choi, Kyungmin Lee, Jongheon Jeong, Saining Xie, Jinwoo Shin, Kimin Lee

NeurIPS 2025 Dynamic Test-Time Compute Scaling in Control Policy: Difficulty-Aware Stochastic Interpolant Policy Inkook Chun, Seungjae Lee, Michael Samuel Albergo, Saining Xie, Eric Vanden-Eijnden

CVPR 2025 Exploring the Deep Fusion of Large Language Models and Diffusion Transformers for Text-to-Image Synthesis Bingda Tang, Boyang Zheng, Sayak Paul, Saining Xie

NeurIPS 2025 LiveCodeBench Pro: How Do Olympiad Medalists Judge LLMs in Competitive Programming? Zihan Zheng, Zerui Cheng, Zeyu Shen, Shang Zhou, Kaiyuan Liu, Hansen He, Dongruixuan Li, Stanley Wei, Hangyi Hao, Jianzhu Yao, Peiyao Sheng, Zixuan Wang, Wenhao Chai, Aleksandra Korolova, Peter Henderson, Sanjeev Arora, Pramod Viswanath, Jingbo Shang, Saining Xie

NeurIPS 2025 Meta CLIP 2: A Worldwide Scaling Recipe Yung-Sung Chuang, Yang Li, Dong Wang, Ching-Feng Yeh, Kehan Lyu, Ramya Raghavendra, James R. Glass, Lifei Huang, Jason E Weston, Luke Zettlemoyer, Xinlei Chen, Zhuang Liu, Saining Xie, Wen-tau Yih, Shang-Wen Li, Hu Xu

ICCV 2025 MetaMorph: Multimodal Understanding and Generation via Instruction Tuning Shengbang Tong, David Fan, Jiachen Li, Yunyang Xiong, Xinlei Chen, Koustuv Sinha, Michael Rabbat, Yann LeCun, Saining Xie, Zhuang Liu

ICLR 2025 On Scaling up 3D Gaussian Splatting Training Hexu Zhao, Haoyang Weng, Daohan Lu, Ang Li, Jinyang Li, Aurojit Panda, Saining Xie

ICML 2025 PISA Experiments: Exploring Physics Post-Training for Video Diffusion Models by Watching Stuff Drop Chenyu Li, Oscar Michel, Xichen Pan, Sainan Liu, Mike Roberts, Saining Xie

ICCV 2025 REPA-E: Unlocking VAE for End-to-End Tuning of Latent Diffusion Transformers Xingjian Leng, Jaskirat Singh, Yunzhong Hou, Zhenchang Xing, Saining Xie, Liang Zheng

ICLR 2025 Representation Alignment for Generation: Training Diffusion Transformers Is Easier than You Think Sihyun Yu, Sangkyung Kwak, Huiwon Jang, Jongheon Jeong, Jonathan Huang, Jinwoo Shin, Saining Xie

ICML 2025 SFT Memorizes, RL Generalizes: A Comparative Study of Foundation Model Post-Training Tianzhe Chu, Yuexiang Zhai, Jihan Yang, Shengbang Tong, Saining Xie, Dale Schuurmans, Quoc V Le, Sergey Levine, Yi Ma

CVPR 2025 Scaling Inference Time Compute for Diffusion Models Nanye Ma, Shangyuan Tong, Haolin Jia, Hexiang Hu, Yu-Chuan Su, Mingda Zhang, Xuan Yang, Yandong Li, Tommi Jaakkola, Xuhui Jia, Saining Xie

ICCV 2025 Scaling Language-Free Visual Representation Learning David Fan, Shengbang Tong, Jiachen Zhu, Koustuv Sinha, Zhuang Liu, Xinlei Chen, Michael Rabbat, Nicolas Ballas, Yann LeCun, Amir Bar, Saining Xie

CVPR 2025 Science-T2I: Addressing Scientific Illusions in Image Synthesis Jialuo Li, Wenhao Chai, Xingyu Fu, Haiyang Xu, Saining Xie

CVPR 2025 Thinking in Space: How Multimodal Large Language Models See, Remember, and Recall Spaces Jihan Yang, Shusheng Yang, Anjali W. Gupta, Rilyn Han, Li Fei-Fei, Saining Xie

NeurIPS 2024 Cambrian-1: A Fully Open, Vision-Centric Exploration of Multimodal LLMs Shengbang Tong, Ellis Brown, Penghao Wu, Sanghyun Woo, Manoj Middepogu, Sai Charitha Akula, Jihan Yang, Shusheng Yang, Adithya Iyer, Xichen Pan, Austin Wang, Rob Fergus, Yann LeCun, Saining Xie

ICLR 2024 Demystifying CLIP Data Hu Xu, Saining Xie, Xiaoqing Tan, Po-Yao Huang, Russell Howes, Vasu Sharma, Shang-Wen Li, Gargi Ghosh, Luke Zettlemoyer, Christoph Feichtenhofer

ICMLW 2024 DiffusionGuard: A Robust Defense Against Malicious Diffusion-Based Image Editing June Suk Choi, Kyungmin Lee, Jongheon Jeong, Saining Xie, Jinwoo Shin, Kimin Lee

CVPR 2024 Eyes Wide Shut? Exploring the Visual Shortcomings of Multimodal LLMs Shengbang Tong, Zhuang Liu, Yuexiang Zhai, Yi Ma, Yann LeCun, Saining Xie

ECCV 2024 Fast Encoding and Decoding for Implicit Video Representation Hao Chen, Saining Xie, Ser-Nam Lim, Abhinav Shrivastava

NeurIPS 2024 Fine-Tuning Large Vision-Language Models as Decision-Making Agents via Reinforcement Learning Yuexiang Zhai, Hao Bai, Zipeng Lin, Jiayi Pan, Shengbang Tong, Yifei Zhou, Alane Suhr, Saining Xie, Yann LeCun, Yi Ma, Sergey Levine

CVPR 2024 Image Sculpting: Precise Object Editing with 3D Geometry Control Jiraphon Yenphraphai, Xichen Pan, Sainan Liu, Daniele Panozzo, Saining Xie

CVPR 2024 MoDE: CLIP Data Experts via Clustering Jiawei Ma, Po-Yao Huang, Saining Xie, Shang-Wen Li, Luke Zettlemoyer, Shih-Fu Chang, Wen-Tau Yih, Hu Xu

ECCVW 2024 On Scaling up 3D Gaussian Splatting Training Hexu Zhao, Haoyang Weng, Daohan Lu, Ang Li, Jinyang Li, Aurojit Panda, Saining Xie

ECCV 2024 SiT: Exploring Flow and Diffusion-Based Generative Models with Scalable Interpolant Transformers Nanye Ma, Mark Goldstein, Michael Albergo, Nicholas M Boffi, Eric Vanden-Eijnden, Saining Xie

ECCV 2024 V-IRL: Grounding Virtual Intelligence in Real Life Jihan Yang, Runyu Ding, Ellis L Brown, Xiaojuan Qi, Saining Xie

CVPR 2024 V?: Guided Visual Search as a Core Mechanism in Multimodal LLMs Penghao Wu, Saining Xie

ICCV 2023 CiT: Curation in Training for Effective Vision-Language Data Hu Xu, Saining Xie, Po-Yao Huang, Licheng Yu, Russell Howes, Gargi Ghosh, Luke Zettlemoyer, Christoph Feichtenhofer

CVPR 2023 ConvNeXt V2: Co-Designing and Scaling ConvNets with Masked Autoencoders Sanghyun Woo, Shoubhik Debnath, Ronghang Hu, Xinlei Chen, Zhuang Liu, In So Kweon, Saining Xie

ICCV 2023 Going Denser with Open-Vocabulary Part Segmentation Peize Sun, Shoufa Chen, Chenchen Zhu, Fanyi Xiao, Ping Luo, Saining Xie, Zhicheng Yan

ICCV 2023 Scalable Diffusion Models with Transformers William Peebles, Saining Xie

CVPR 2022 A ConvNet for the 2020s Zhuang Liu, Hanzi Mao, Chao-Yuan Wu, Christoph Feichtenhofer, Trevor Darrell, Saining Xie

CVPR 2022 Masked Autoencoders Are Scalable Vision Learners Kaiming He, Xinlei Chen, Saining Xie, Yanghao Li, Piotr Dollár, Ross Girshick

CVPR 2022 Masked Feature Prediction for Self-Supervised Visual Pre-Training Chen Wei, Haoqi Fan, Saining Xie, Chao-Yuan Wu, Alan Yuille, Christoph Feichtenhofer

ECCV 2022 SLIP: Self-Supervision Meets Language-Image Pre-Training Norman Mu, Alexander Kirillov, David Wagner, Saining Xie

ICCV 2021 An Empirical Study of Training Self-Supervised Vision Transformers Xinlei Chen, Saining Xie, Kaiming He

CVPR 2021 Exploring Data-Efficient 3D Scene Understanding with Contrastive Scene Contexts Ji Hou, Benjamin Graham, Matthias Niessner, Saining Xie

NeurIPS 2021 On Interaction Between Augmentations and Corruptions in Natural Corruption Robustness Eric Mintun, Alexander Kirillov, Saining Xie

ICCV 2021 Pri3D: Can 3D Priors Help 2D Representation Learning? Ji Hou, Saining Xie, Benjamin Graham, Angela Dai, Matthias Nießner

ECCV 2020 Are Labels Necessary for Neural Architecture Search? Chenxi Liu, Piotr Dollár, Kaiming He, Ross Girshick, Alan Yuille, Saining Xie

ICLR 2020 Decoupling Representation and Classifier for Long-Tailed Recognition Bingyi Kang, Saining Xie, Marcus Rohrbach, Zhicheng Yan, Albert Gordo, Jiashi Feng, Yannis Kalantidis

ICML 2020 Graph Structure of Neural Networks Jiaxuan You, Jure Leskovec, Kaiming He, Saining Xie

ECCV 2020 PointContrast: Unsupervised Pre-Training for 3D Point Cloud Understanding Saining Xie, Jiatao Gu, Demi Guo, Charles R. Qi, Leonidas Guibas, Or Litany

ECCV 2018 Rethinking Spatiotemporal Feature Learning: Speed-Accuracy Trade-Offs in Video Classification Saining Xie, Chen Sun, Jonathan Huang, Zhuowen Tu, Kevin Murphy

CVPR 2017 Aggregated Residual Transformations for Deep Neural Networks Saining Xie, Ross Girshick, Piotr Dollar, Zhuowen Tu, Kaiming He

ECCV 2016 Top-Down Learning for Structured Labeling with Convolutional Pseudoprior Saining Xie, Xun Huang, Zhuowen Tu

AISTATS 2015 Deeply-Supervised Nets Chen-Yu Lee, Saining Xie, Patrick W. Gallagher, Zhengyou Zhang, Zhuowen Tu

ICCV 2015 Holistically-Nested Edge Detection Saining Xie, Zhuowen Tu

CVPR 2015 Hyper-Class Augmented and Regularized Deep Learning for Fine-Grained Image Classification Saining Xie, Tianbao Yang, Xiaoyu Wang, Yuanqing Lin