Ma, Zejun

20 publications

NeurIPS 2025 Afterburner: Reinforcement Learning Facilitates Self-Improving Code Efficiency Optimization Mingzhe Du, Anh Tuan Luu, Yue Liu, Yuhao Qing, Dong Huang, Xinyi He, Qian Liu, Zejun Ma, See-Kiong Ng

NeurIPS 2025 General-Reasoner: Advancing LLM Reasoning Across All Domains Xueguang Ma, Qian Liu, Dongfu Jiang, Ge Zhang, Zejun Ma, Wenhu Chen

ICML 2025 Improving LLM Video Understanding with 16 Frames per Second Yixuan Li, Changli Tang, Jimin Zhuang, Yudong Yang, Guangzhi Sun, Wei Li, Zejun Ma, Chao Zhang

ICLR 2025 LLaVA-Interleave: Tackling Multi-Image, Video, and 3D in Large Multimodal Models Feng Li, Renrui Zhang, Hao Zhang, Yuanhan Zhang, Bo Li, Wei Li, Zejun Ma, Chunyuan Li

TMLR 2025 LLaVA-Video: Video Instruction Tuning with Synthetic Data Yuanhan Zhang, Jinming Wu, Wei Li, Bo Li, Zejun Ma, Ziwei Liu, Chunyuan Li

CVPR 2025 LiveCC: Learning Video LLM with Streaming Speech Transcription at Scale Joya Chen, Ziyun Zeng, Yiqi Lin, Wei Li, Zejun Ma, Mike Zheng Shou

NeurIPS 2025 Robust SuperAlignment: Weak-to-Strong Robustness Generalization for Vision-Language Models Junhao Dong, Cong Zhang, Xinghua Qu, Zejun Ma, Piotr Koniusz, Yew-Soon Ong

ICML 2025 Video-SALMONN-O1: Reasoning-Enhanced Audio-Visual Large Language Model Guangzhi Sun, Yudong Yang, Jimin Zhuang, Changli Tang, Yixuan Li, Wei Li, Zejun Ma, Chao Zhang

NeurIPS 2025 VisionThink: Smart and Efficient Vision Language Model via Reinforcement Learning Senqiao Yang, Junyi Li, Xin Lai, Jinming Wu, Wei Li, Zejun Ma, Bei Yu, Hengshuang Zhao, Jiaya Jia

NeurIPS 2025 ZeCO: Zero-Communication Overhead Sequence Parallelism for Linear Attention Yuhong Chou, Zehao Liu, Rui-Jie Zhu, Xinyi Wan, Tianjian Li, Congying Chu, Qian Liu, Jibin Wu, Zejun Ma

ICLR 2024 Mega-TTS 2: Boosting Prompting Mechanisms for Zero-Shot Speech Synthesis Ziyue Jiang, Jinglin Liu, Yi Ren, Jinzheng He, Zhenhui Ye, Shengpeng Ji, Qian Yang, Chen Zhang, Pengfei Wei, Chunfeng Wang, Xiang Yin, Zejun Ma, Zhou Zhao

ICLR 2024 PolyVoice: Language Models for Speech to Speech Translation Qian qian Dong, Zhiying Huang, Qiao Tian, Chen Xu, Tom Ko, Yunlong Zhao, Siyuan Feng, Tang Li, Kexin Wang, Xuxin Cheng, Fengpeng Yue, Ye Bai, Xi Chen, Lu Lu, Zejun Ma, Yuping Wang, Mingxuan Wang, Yuxuan Wang

ECCV 2024 RePOSE: 3D Human Pose Estimation via Spatio-Temporal Depth Relational Consistency Ziming Sun, Yuan Liang, Zejun Ma, Tianle Zhang, Linchao Bao, Guiqing Li, Shengfeng He

ICLR 2024 Real3D-Portrait: One-Shot Realistic 3D Talking Portrait Synthesis Zhenhui Ye, Tianyun Zhong, Yi Ren, Jiaqi Yang, Weichuang Li, Jiawei Huang, Ziyue Jiang, Jinzheng He, Rongjie Huang, Jinglin Liu, Chen Zhang, Xiang Yin, Zejun Ma, Zhou Zhao

ICLR 2024 SALMONN: Towards Generic Hearing Abilities for Large Language Models Changli Tang, Wenyi Yu, Guangzhi Sun, Xianzhao Chen, Tian Tan, Wei Li, Lu Lu, Zejun Ma, Chao Zhang

ICML 2024 Video-SALMONN: Speech-Enhanced Audio-Visual Large Language Models Guangzhi Sun, Wenyi Yu, Changli Tang, Xianzhao Chen, Tian Tan, Wei Li, Lu Lu, Zejun Ma, Yuxuan Wang, Chao Zhang

IJCAI 2023 AudioQR: Deep Neural Audio Watermarks for QR Code Xinghua Qu, Xiang Yin, Pengfei Wei, Lu Lu, Zejun Ma

ICCV 2023 Virtual Try-on with Pose-Garment Keypoints Guided Inpainting Zhi Li, Pengfei Wei, Xiang Yin, Zejun Ma, Alex C. Kot

IJCAI 2022 BiFSMN: Binary Neural Network for Keyword Spotting Haotong Qin, Xudong Ma, Yifu Ding, Xiaoyang Li, Yang Zhang, Yao Tian, Zejun Ma, Jie Luo, Xianglong Liu

AAAI 2022 Zero-Shot Audio Source Separation Through Query-Based Learning from Weakly-Labeled Data Ke Chen, Xingjian Du, Bilei Zhu, Zejun Ma, Taylor Berg-Kirkpatrick, Shlomo Dubnov