Tao, Dingwen

4 publications

NeurIPS 2025 ElasticMM: Efficient Multimodal LLMs Serving with Elastic Multimodal Parallelism Zedong Liu, Shenggan Cheng, Guangming Tan, Yang You, Dingwen Tao

CPAL 2024 HRBP: Hardware-Friendly Regrouping Towards Block-Based Pruning for Sparse CNN Training Haoyu Ma, Chengming Zhang, Lizhi Xiang, Xiaolong Ma, Geng Yuan, Wenkai Zhang, Shiwei Liu, Tianlong Chen, Dingwen Tao, Yanzhi Wang, Zhangyang Wang, Xiaohui Xie

NeurIPS 2024 SDP4Bit: Toward 4-Bit Communication Quantization in Sharded Data Parallelism for LLM Training Jinda Jia, Cong Xie, Hanlin Lu, Daoce Wang, Hao Feng, Chengming Zhang, Baixi Sun, Haibin Lin, Zhi Zhang, Xin Liu, Dingwen Tao

AAAI 2023 HALOC: Hardware-Aware Automatic Low-Rank Compression for Compact Neural Networks Jinqi Xiao, Chengming Zhang, Yu Gong, Miao Yin, Yang Sui, Lizhi Xiang, Dingwen Tao, Bo Yuan