Chen, Shoufa

16 publications

ICLR 2025 ControlAR: Controllable Image Generation with Autoregressive Models Zongming Li, Tianheng Cheng, Shoufa Chen, Peize Sun, Haocheng Shen, Longjin Ran, Xiaoxin Chen, Wenyu Liu, Xinggang Wang

TMLR 2025 Efficient Diffusion Models: A Survey Hui Shen, Jingxuan Zhang, Boning Xiong, Rui Hu, Shoufa Chen, Zhongwei Wan, Xin Wang, Yu Zhang, Zixuan Gong, Guangyin Bao, Chaofan Tao, Yongfeng Huang, Ye Yuan, Mi Zhang

CVPR 2025 Goku: Flow Based Video Generative Foundation Models Shoufa Chen, Chongjian Ge, Yuqi Zhang, Yida Zhang, Fengda Zhu, Hao Yang, Hongxiang Hao, Hui Wu, Zhichao Lai, Yifei Hu, Ting-Che Lin, Shilong Zhang, Fu Li, Chuan Li, Xing Wang, Yanghua Peng, Peize Sun, Ping Luo, Yi Jiang, Zehuan Yuan, Bingyue Peng, Xiaobing Liu

ICCV 2025 Prompt-a-Video: Prompt Your Video Diffusion Model via Preference-Aligned LLM Yatai Ji, Jiacheng Zhang, Jie Wu, Shilong Zhang, Shoufa Chen, Chongjian Ge, Peize Sun, Weifeng Chen, Wenqi Shao, Xuefeng Xiao, Weilin Huang, Ping Luo

NeurIPS 2025 WorldWeaver: Generating Long-Horizon Video Worlds via Rich Perception Zhiheng Liu, Xueqing Deng, Shoufa Chen, Angtian Wang, Qiushan Guo, Mingfei Han, Zeyue Xue, Mengzhao Chen, Ping Luo, Linjie Yang

ICLR 2024 FLATTEN: Optical FLow-Guided ATTENtion for Consistent Text-to-Video Editing Yuren Cong, Mengmeng Xu, Christian Simon, Shoufa Chen, Jiawei Ren, Yanping Xie, Juan-Manuel Perez-Rua, Bodo Rosenhahn, Tao Xiang, Sen He

ECCVW 2024 GPT4RoI: Instruction Tuning Large Language Model on Region-of-Interest Shilong Zhang, Peize Sun, Shoufa Chen, Min Xiao, Wenqi Shao, Wenwei Zhang, Yu Liu, Kai Chen, Ping Luo

CVPR 2024 GenTron: Diffusion Transformers for Image and Video Generation Shoufa Chen, Mengmeng Xu, Jiawei Ren, Yuren Cong, Sen He, Yanping Xie, Animesh Sinha, Ping Luo, Tao Xiang, Juan-Manuel Perez-Rua

ICML 2024 RoboCodeX: Multimodal Code Generation for Robotic Behavior Synthesis Yao Mu, Junting Chen, Qing-Long Zhang, Shoufa Chen, Qiaojun Yu, Chongjian Ge, Runjian Chen, Zhixuan Liang, Mengkang Hu, Chaofan Tao, Peize Sun, Haibao Yu, Chao Yang, Wenqi Shao, Wenhai Wang, Jifeng Dai, Yu Qiao, Mingyu Ding, Ping Luo

ICCV 2023 DiffusionDet: Diffusion Model for Object Detection Shoufa Chen, Peize Sun, Yibing Song, Ping Luo

ICCV 2023 Going Denser with Open-Vocabulary Part Segmentation Peize Sun, Shoufa Chen, Chenchen Zhu, Fanyi Xiao, Ping Luo, Saining Xie, Zhicheng Yan

ICLR 2023 Soft Neighbors Are Positive Supporters in Contrastive Visual Representation Learning Chongjian Ge, Jiangliu Wang, Zhan Tong, Shoufa Chen, Yibing Song, Ping Luo

NeurIPS 2022 AdaptFormer: Adapting Vision Transformers for Scalable Visual Recognition Shoufa Chen, Chongjian Ge, Zhan Tong, Jiangliu Wang, Yibing Song, Jue Wang, Ping Luo

ICML 2022 CtrlFormer: Learning Transferable State Representation for Visual Control via Transformer Yao Mark Mu, Shoufa Chen, Mingyu Ding, Jianyu Chen, Runjian Chen, Ping Luo

ICLR 2022 CycleMLP: A MLP-like Architecture for Dense Prediction Shoufa Chen, Enze Xie, Chongjian Ge, Runjian Chen, Ding Liang, Ping Luo

ICCV 2021 Watch Only Once: An End-to-End Video Action Detection Framework Shoufa Chen, Peize Sun, Enze Xie, Chongjian Ge, Jiannan Wu, Lan Ma, Jiajun Shen, Ping Luo