Joseph, Ajin George

5 publications

TMLR 2026 Mitigating Steady-State Bias in Off-Policy TD Learning via Distributional Correction Emani Naga Sai Venkata Sowmya, Amit Kesari, Ajin George Joseph

TMLR 2025 Risk‑Seeking Reinforcement Learning via Multi‑Timescale EVaR Optimization Deep Kumar Ganguly, Ajin George Joseph, Sarthak Girotra, Sirish Sekhar

ICLR 2023 Greedy Actor-Critic: A New Conditional Cross-Entropy Method for Policy Improvement Samuel Neumann, Sungsu Lim, Ajin George Joseph, Yangchen Pan, Adam White, Martha White

MLJ 2018 An Incremental Off-Policy Search in a Model-Free Markov Decision Process Using a Single Sample Path Ajin George Joseph, Shalabh Bhatnagar

MLJ 2018 An Online Prediction Algorithm for Reinforcement Learning with Linear Function Approximation Using Cross Entropy Method Ajin George Joseph, Shalabh Bhatnagar