Ma, Ziyang

12 publications

AAAI 2025 ELLA-V: Stable Neural Codec Language Modeling with Alignment-Guided Sequence Reordering Yakun Song, Zhuo Chen, Xiaofei Wang, Ziyang Ma, Xie Chen

AAAI 2025 Language Model Can Listen While Speaking Ziyang Ma, Yakun Song, Chenpeng Du, Jian Cong, Zhuo Chen, Yuping Wang, Yuxuan Wang, Xie Chen

NeurIPS 2025 MMAR: A Challenging Benchmark for Deep Reasoning in Speech, Audio, Music, and Their Mix Ziyang Ma, Yinghao Ma, Yanqiao Zhu, Chen Yang, Yi-Wen Chao, Ruiyang Xu, Wenxi Chen, Yuanzhe Chen, Zhuo Chen, Jian Cong, Kai Li, Keliang Li, Siyou Li, Xinfeng Li, Xiquan Li, Zheng Lian, Yuzhe Liang, Minghao Liu, Zhikang Niu, Tianrui Wang, Yuping Wang, Yuxuan Wang, Yihao Wu, Guanrou Yang, Jianwei Yu, Ruibin Yuan, Zhisheng Zheng, Ziya Zhou, Haina Zhu, Wei Xue, Emmanouil Benetos, Kai Yu, EngSiong Chng, Xie Chen

ICLR 2025 MuPT: A Generative Symbolic Music Pretrained Transformer Xingwei Qu, Yuelin Bai, Yinghao Ma, Ziya Zhou, Ka Man Lo, Jiaheng Liu, Ruibin Yuan, Lejun Min, Xueling Liu, Tianyu Zhang, Xeron Du, Shuyue Guo, Yiming Liang, Yizhi Li, Shangda Wu, Junting Zhou, Tianyu Zheng, Ziyang Ma, Fengze Han, Wei Xue, Gus Xia, Emmanouil Benetos, Xiang Yue, Chenghua Lin, Xu Tan, Wenhao Huang, Jie Fu, Ge Zhang

AAAI 2025 Speech Recognition Meets Large Language Model: Benchmarking, Models, and Exploration Ziyang Ma, Guanrou Yang, Yifan Yang, Zhifu Gao, Jiaming Wang, Zhihao Du, Fan Yu, Qian Chen, Siqi Zheng, Shiliang Zhang, Xie Chen

AAAI 2025 VQTalker: Towards Multilingual Talking Avatars Through Facial Motion Tokenization Tao Liu, Ziyang Ma, Qi Chen, Feilong Chen, Shuai Fan, Xie Chen, Kai Yu

NeurIPS 2025 Word-Level Emotional Expression Control in Zero-Shot Text-to-Speech Synthesis Tianrui Wang, Haoyu Wang, Meng Ge, Cheng Gong, Chunyu Qiang, Ziyang Ma, Zikang Huang, Guanrou Yang, Xiaobao Wang, EngSiong Chng, Xie Chen, Longbiao Wang, Jianwu Dang

ICML 2024 BAT: Learning to Reason About Spatial Sounds with Large Language Models Zhisheng Zheng, Puyuan Peng, Ziyang Ma, Xie Chen, Eunsol Choi, David Harwath

IJCAI 2024 EAT: Self-Supervised Pre-Training with Efficient Audio Transformer Wenxi Chen, Yuzhe Liang, Ziyang Ma, Zhisheng Zheng, Xie Chen

CVPR 2015 Handling Motion Blur in Multi-Frame Super-Resolution Ziyang Ma, Renjie Liao, Xin Tao, Li Xu, Jiaya Jia, Enhua Wu

ICCV 2015 Video Super-Resolution via Deep Draft-Ensemble Learning Renjie Liao, Xin Tao, Ruiyu Li, Ziyang Ma, Jiaya Jia

ICCV 2013 Constant Time Weighted Median Filtering for Stereo Matching and Beyond Ziyang Ma, Kaiming He, Yichen Wei, Jian Sun, Enhua Wu