Ma, Ao

9 publications

AAAI 2025 Bridge Diffusion Model: Bridge Chinese Text-to-Image Diffusion Model with English Communities Shanyuan Liu, Bo Cheng, Yuhang Ma, Liebucha Wu, Ao Ma, Xiaoyu Wu, Dawei Leng, Yuhui Yin

IJCAI 2025 FancyVideo: Towards Dynamic and Consistent Video Generation via Cross-Frame Textual Guidance Jiasong Feng, Ao Ma, Jing Wang, Ke Cao, Zhanjie Zhang

ICCV 2025 Lay2Story: Extending Diffusion Transformers for Layout-Togglable Story Generation Ao Ma, Jiasong Feng, Ke Cao, Jing Wang, Yun Wang, Quanwei Zhang, Zhanjie Zhang

ICCV 2025 Learning Robust Stereo Matching in the Wild with Selective Mixture-of-Experts Yun Wang, Longguang Wang, Chenghao Zhang, Yongjian Zhang, Zhanjie Zhang, Ao Ma, Chenyou Fan, Tin Lun Lam, Junjie Hu

ICLR 2025 PT-T2I/V: An Efficient Proxy-Tokenized Diffusion Transformer for Text-to-Image/Video-Task Jing Wang, Ao Ma, Jiasong Feng, Dawei Leng, Yuhui Yin, Xiaodan Liang

ICCV 2025 PlanGen: Towards Unified Layout Planning and Image Generation in Auto-Regressive Vision Language Models Runze He, Bo Cheng, Yuhang Ma, Qingxiang Jia, Shanyuan Liu, Ao Ma, Xiaoyu Wu, Liebucha Wu, Dawei Leng, Yuhui Yin

NeurIPS 2025 WISA: World Simulator Assistant for Physics-Aware Text-to-Video Generation Jing Wang, Ao Ma, Ke Cao, Jun Zheng, Jiasong Feng, Zhanjie Zhang, Wanyuan Pang, Xiaodan Liang

NeurIPS 2024 HiCo: Hierarchical Controllable Diffusion Model for Layout-to-Image Generation Bo Cheng, Yuhang Ma, Liebucha Wu, Shanyuan Liu, Ao Ma, Xiaoyu Wu, Dawei Leng, Yuhui Yin

NeurIPS 2023 Res-Tuning: A Flexible and Efficient Tuning Paradigm via Unbinding Tuner from Backbone Zeyinzi Jiang, Chaojie Mao, Ziyuan Huang, Ao Ma, Yiliang Lv, Yujun Shen, Deli Zhao, Jingren Zhou