Ma, Zhiyuan

25 publications

AAAI 2025 Automated Creation of Reusable and Diverse Toolsets for Enhancing LLM Reasoning Zhiyuan Ma, Zhenya Huang, Jiayu Liu, Minmao Wang, Hongke Zhao, Xin Li

NeurIPS 2025 CADGrasp: Learning Contact and Collision Aware General Dexterous Grasping in Cluttered Scenes Jiyao Zhang, Zhiyuan Ma, Tianhao Wu, Zeyuan Chen, Hao Dong

AAAI 2025 DreamAlign: Dynamic Text-to-3D Optimization with Human Preference Alignment Gaofeng Liu, Zhiyuan Ma, Tao Fang

CVPR 2025 MVBoost: Boost 3D Reconstruction with Multi-View Refinement Xiangyu Liu, Xiaomei Zhang, Zhiyuan Ma, Xiangyu Zhu, Zhen Lei

CVPR 2025 Pixel-Level and Semantic-Level Adjustable Super-Resolution: A Dual-LoRA Approach Lingchen Sun, Rongyuan Wu, Zhiyuan Ma, Shuaizheng Liu, Qiaosi Yi, Lei Zhang

CVPR 2025 Progressive Rendering Distillation: Adapting Stable Diffusion for Instant Text-to-Mesh Generation Without 3D Data Zhiyuan Ma, Xinyue Liang, Rongyuan Wu, Xiangyu Zhu, Zhen Lei, Lei Zhang

AAAI 2025 Retrieval-Augmented Visual Question Answering via Built-in Autoregressive Search Engines Xinwei Long, Zhiyuan Ma, Ermo Hua, Kaiyan Zhang, Biqing Qi, Bowen Zhou

NeurIPS 2025 TTRL: Test-Time Reinforcement Learning Yuxin Zuo, Kaiyan Zhang, Li Sheng, Shang Qu, Ganqu Cui, Xuekai Zhu, Haozhan Li, Yuchen Zhang, Xinwei Long, Ermo Hua, Biqing Qi, Youbang Sun, Zhiyuan Ma, Lifan Yuan, Ning Ding, Bowen Zhou

NeurIPS 2025 UniTransfer: Video Concept Transfer via Progressive Spatio-Temporal Decomposition Guojunlei, Rong Zhang, Tianhang Liu, Hong Li, Zhiyuan Ma, Chi Wang, Weiwei Xu

CVPR 2025 VideoDirector: Precise Video Editing via Text-to-Video Models Yukun Wang, Longguang Wang, Zhiyuan Ma, Qibin Hu, Kai Xu, Yulan Guo

NeurIPS 2025 Zero-Shot Blind-Spot Image Denoising via Cross-Scale Non-Local Pixel Refilling Qilong Guo, Tianjing Zhang, Zhiyuan Ma, Hui Ji

CVPR 2025 Zero-Shot Blind-Spot Image Denoising via Implicit Neural Sampling Yuhui Quan, Tianxiang Zheng, Zhiyuan Ma, Hui Ji

AAAI 2024 AdapEdit: Spatio-Temporal Guided Adaptive Editing Algorithm for Text-Based Continuity-Sensitive Image Editing Zhiyuan Ma, Guoli Jia, Bowen Zhou

ECCV 2024 Dense Multimodal Alignment for Open-Vocabulary 3D Scene Understanding Ruihuang Li, Zhengqiang Zhang, Chenhang He, Zhiyuan Ma, Vishal Patel, Lei Zhang

CVPR 2024 Dual Memory Networks: A Versatile Adaptation Approach for Vision-Language Models Yabin Zhang, Wenjie Zhu, Hui Tang, Zhiyuan Ma, Kaiyang Zhou, Lei Zhang

NeurIPS 2024 Exploring Adversarial Robustness of Deep State Space Models Biqing Qi, Yiang Luo, Junqi Gao, Pengfei Li, Kai Tian, Zhiyuan Ma, Bowen Zhou

AAAI 2024 Generative Multi-Modal Knowledge Retrieval with Large Language Models Xinwei Long, Jiali Zeng, Fandong Meng, Zhiyuan Ma, Kaiyan Zhang, Bowen Zhou, Jie Zhou

AAAI 2024 LMD: Faster Image Reconstruction with Latent Masking Diffusion Zhiyuan Ma, Zhihuan Yu, Jianjun Li, Bowen Zhou

NeurIPS 2024 Neural Residual Diffusion Models for Deep Scalable Vision Generation Zhiyuan Ma, Liangliang Zhao, Biqing Qi, Bowen Zhou

NeurIPS 2024 One-Step Effective Diffusion Network for Real-World Image Super-Resolution Rongyuan Wu, Lingchen Sun, Zhiyuan Ma, Lei Zhang

ECCV 2024 ScaleDreamer: Scalable Text-to-3D Synthesis with Asynchronous Score Distillation Zhiyuan Ma, Yuxiang Wei, Yabin Zhang, Xiangyu Zhu, Zhen Lei, Lei Zhang

NeurIPS 2024 UltraMedical: Building Specialized Generalists in Biomedicine Kaiyan Zhang, Sihang Zeng, Ermo Hua, Ning Ding, Zhang-Ren Chen, Zhiyuan Ma, Haoxin Li, Ganqu Cui, Biqing Qi, Xuekai Zhu, Xingtai Lv, Jin-Fang Hu, Zhiyuan Liu, Bowen Zhou

AAAI 2023 HybridPrompt: Bridging Language Models and Human Priors in Prompt Tuning for Visual Question Answering Zhiyuan Ma, Zhihuan Yu, Jianjun Li, Guohui Li

CVPR 2023 OTAvatar: One-Shot Talking Face Avatar with Controllable Tri-Plane Rendering Zhiyuan Ma, Xiangyu Zhu, Guo-Jun Qi, Zhen Lei, Lei Zhang

AAAI 2017 AniDraw: When Music and Dance Meet Harmoniously Yaohua Bu, Taoran Tang, Jia Jia, Zhiyuan Ma, Songyao Wu, Yuming You