Wang, Mingze

14 publications

ICLRW 2025 A Single Global Merging Suffices: Recovering Centralized Learning Performance in Decentralized Learning Tongtian Zhu, Tianyu Zhang, Mingze Wang, Zhanpeng Zhou, Can Wang

NeurIPS 2025 On the Expressive Power of Mixture-of-Experts for Structured Complex Tasks Mingze Wang, Weinan E

ICLR 2025 Sharpness-Aware Minimization Efficiently Selects Flatter Minima Late in Training Zhanpeng Zhou, Mingze Wang, Yuchen Mao, Bingrui Li, Junchi Yan

ICML 2025 The Sharpness Disparity Principle in Transformers for Accelerating Language Model Pre-Training Jinbo Wang, Mingze Wang, Zhanpeng Zhou, Junchi Yan, Weinan E, Lei Wu

ICML 2024 Achieving Margin Maximization Exponentially Fast via Progressive Norm Rescaling Mingze Wang, Zeping Min, Lei Wu

NeurIPS 2024 Improving Generalization and Convergence by Enhancing Implicit Regularization Mingze Wang, Jinbo Wang, Haotian He, Zilin Wang, Guanhua Huang, Feiyu Xiong, Zhiyu Li, Weinan E, Lei Wu

ICML 2024 Learning 1-Bit Tiny Object Detector with Discriminative Feature Refinement Sheng Xu, Mingze Wang, Yanjing Li, Mingbao Lin, Baochang Zhang, David Doermann, Xiao Sun

NeurIPS 2024 Parameter Symmetry and Noise Equilibrium of Stochastic Gradient Descent Liu Ziyin, Mingze Wang, Hongchao Li, Lei Wu

NeurIPSW 2024 Parameter Symmetry and Noise Equilibrium of Stochastic Gradient Descent Liu Ziyin, Mingze Wang, Hongchao Li, Lei Wu

NeurIPS 2024 Understanding the Expressive Power and Mechanisms of Transformer for Sequence Modeling Mingze Wang, Weinan E

NeurIPSW 2023 The Noise Geometry of Stochastic Gradient Descent: A Quantitative and Analytical Characterization Mingze Wang, Lei Wu

NeurIPS 2023 Understanding Multi-Phase Optimization Dynamics and Rich Nonlinear Behaviors of ReLU Networks Mingze Wang, Chao Ma

NeurIPS 2022 Early Stage Convergence and Global Convergence of Training Mildly Parameterized Neural Networks Mingze Wang, Chao Ma

NeurIPS 2022 The Alignment Property of SGD Noise and How It Helps Select Flat Minima: A Stability Analysis Lei Wu, Mingze Wang, Weijie Su