Mondal, Washim Uddin

15 publications

ICML 2025 A Sharper Global Convergence Analysis for Average Reward Reinforcement Learning via an Actor-Critic Approach Swetha Ganesh, Washim Uddin Mondal, Vaneet Aggarwal

NeurIPS 2025 Finite-Sample Analysis of Policy Evaluation for Robust Average Reward Reinforcement Learning Yang Xu, Washim Uddin Mondal, Vaneet Aggarwal

NeurIPS 2025 Global Convergence for Average Reward Constrained MDPs with Primal-Dual Actor Critic Algorithm Yang Xu, Swetha Ganesh, Washim Uddin Mondal, Qinbo Bai, Vaneet Aggarwal

TMLR 2025 MOORL: A Framework for Integrating Offline-Online Reinforcement Learning Gaurav Chaudhary, Washim Uddin Mondal, Laxmidhar Behera

UAI 2025 Order-Optimal Global Convergence for Actor-Critic with General Policy and Neural Critic Parametrization Swetha Ganesh, Jiayu Chen, Washim Uddin Mondal, Vaneet Aggarwal

AISTATS 2025 Order-Optimal Regret with Novel Policy Gradient Approaches in Infinite-Horizon Average Reward MDPs Swetha Ganesh, Washim Uddin Mondal, Vaneet Aggarwal

NeurIPS 2024 Learning General Parameterized Policies for Infinite Horizon Average Reward Constrained MDPs via Primal-Dual Policy Gradient Algorithm Qinbo Bai, Washim Uddin Mondal, Vaneet Aggarwal

JMLR 2024 Mean-Field Approximation of Cooperative Constrained Multi-Agent Reinforcement Learning (CMARL) Washim Uddin Mondal, Vaneet Aggarwal, Satish V. Ukkusuri

AAAI 2024 Regret Analysis of Policy Gradient Algorithm for Infinite Horizon Average Reward Markov Decision Processes Qinbo Bai, Washim Uddin Mondal, Vaneet Aggarwal

NeurIPS 2024 Sample-Efficient Constrained Reinforcement Learning with General Parameterization Washim Uddin Mondal, Vaneet Aggarwal

TMLR 2023 Mean-Field Control Based Approximation of Multi-Agent Reinforcement Learning in Presence of a Non-Decomposable Shared Global State Washim Uddin Mondal, Vaneet Aggarwal, Satish Ukkusuri

TMLR 2023 Reinforcement Learning with Delayed, Composite, and Partially Anonymous Reward Washim Uddin Mondal, Vaneet Aggarwal

UAI 2022 Can Mean Field Control (mfc) Approximate Cooperative Multi Agent Reinforcement Learning (marl) with Non-Uniform Interaction? Washim Uddin Mondal, Vaneet Aggarwal, Satish V. Ukkusuri

JMLR 2022 On the Approximation of Cooperative Heterogeneous Multi-Agent Reinforcement Learning (MARL) Using Mean Field Control (MFC) Washim Uddin Mondal, Mridul Agarwal, Vaneet Aggarwal, Satish V. Ukkusuri

TMLR 2022 On the Near-Optimality of Local Policies in Large Cooperative Multi-Agent Reinforcement Learning Washim Uddin Mondal, Vaneet Aggarwal, Satish Ukkusuri