Varakantham, Pradeep

61 publications

ICLR 2025 Bootstrapping Language Models with DPO Implicit Rewards Changyu Chen, Zichen Liu, Chao Du, Tianyu Pang, Qian Liu, Arunesh Sinha, Pradeep Varakantham, Min Lin

ICLRW 2025 Evolving RL: Discovering New Activation Functions Using LLMs Kalyan Varma Nadimpalli, Shashank Reddy Chirra, Pradeep Varakantham, Stefan Bauer

AAAI 2025 Marginal Benefit Driven RL Teacher for Unsupervised Environment Design Dexun Li, Wenjun Li, Pradeep Varakantham

NeurIPS 2025 No Experts, No Problem: Avoidance Learning from Bad Demonstrations Huy Hoang, Tien Anh Mai, Pradeep Varakantham

AAAI 2025 Offline Safe Reinforcement Learning Using Trajectory Classification Ze Gong, Akshat Kumar, Pradeep Varakantham

ICLR 2025 On Generalization Across Environments in Multi-Objective Reinforcement Learning Jayden Teoh, Pradeep Varakantham, Peter Vamplew

ICLR 2025 On Minimizing Adversarial Counterfactual Error in Adversarial Reinforcement Learning Roman Belaire, Arunesh Sinha, Pradeep Varakantham

ICLR 2025 Semantic Loss Guided Data Efficient Supervised Fine Tuning for Safe Responses in LLMs Yuxiao Lu, Arunesh Sinha, Pradeep Varakantham

ICMLW 2024 Bootstrapping Language Models with DPO Implicit Rewards Changyu Chen, Zichen Liu, Chao Du, Tianyu Pang, Qian Liu, Arunesh Sinha, Pradeep Varakantham, Min Lin

AAAI 2024 Handling Long and Richly Constrained Tasks Through Constrained Hierarchical Reinforcement Learning Yuxiao Lu, Arunesh Sinha, Pradeep Varakantham

AAAI 2024 Imitate the Good and Avoid the Bad: An Incremental Approach to Safe Reinforcement Learning Huy Hoang, Tien Mai, Pradeep Varakantham

NeurIPS 2024 Improving Environment Novelty Quantification for Effective Unsupervised Environment Design Jayden Teoh, Wenjun Li, Pradeep Varakantham

AAAI 2024 Reward Penalties on Augmented States for Solving Richly Constrained RL Effectively Hao Jiang, Tien Mai, Pradeep Varakantham, Huy Hoang

NeurIPSW 2024 S2L-RM: Short-to-Long Reward Modeling Changyu Chen, Zichen Liu, Haonan Wang, Chao Du, Tianyu Pang, Qian Liu, Arunesh Sinha, Pradeep Varakantham, Min Lin

NeurIPS 2024 SPRINQL: Sub-Optimal Demonstrations Driven Offline Imitation Learning Huy Hoang, Tien Mai, Pradeep Varakantham

NeurIPS 2024 Safety Through Feedback in Constrained RL Shashank Reddy Chirra, Pradeep Varakantham, Praveen Paruchuri

AAAI 2024 Unsupervised Training Sequence Design: Efficient and Generalizable Agent Training Wenjun Li, Pradeep Varakantham

AAAI 2023 Constrained Reinforcement Learning in Hard Exploration Problems Pathmanathan Pankayaraj, Pradeep Varakantham

AAAI 2023 Future Aware Pricing and Matching for Sustainable On-Demand Ride Pooling Xianjie Zhang, Pradeep Varakantham, Hao Jiang

IJCAI 2023 Generalization Through Diversity: Improving Unsupervised Environment Design Wenjun Li, Pradeep Varakantham, Dexun Li

NeurIPS 2023 Generative Modelling of Stochastic Actions with Arbitrary Constraints in Reinforcement Learning Changyu Chen, Ramesha Karunasena, Thanh Nguyen, Arunesh Sinha, Pradeep Varakantham

NeurIPSW 2023 Training Reinforcement Learning Agents and Humans with Difficulty-Conditioned Generators Sidney Tio, Pradeep Varakantham

IJCAI 2023 Transferable Curricula Through Difficulty Conditioned Generators Sidney Tio, Pradeep Varakantham

UAI 2022 Efficient Resource Allocation with Fairness Constraints in Restless Multi-Armed Bandits Dexun. Li, Pradeep Varakantham

AAAI 2022 Facilitating Human-Wildlife Cohabitation Through Conflict Prediction Susobhan Ghosh, Pradeep Varakantham, Aniket Bhatkhande, Tamanna Ahmad, Anish Andheria, Wenjun Li, Aparna Taneja, Divy Thakkar, Milind Tambe

AAAI 2022 Field Study in Deploying Restless Multi-Armed Bandits: Assisting Non-Profits in Improving Maternal and Child Health Aditya Mate, Lovish Madaan, Aparna Taneja, Neha Madhiwalla, Shresth Verma, Gargi Singh, Aparna Hegde, Pradeep Varakantham, Milind Tambe

UAI 2021 CLAIM: Curriculum Learning Policy for Influence Maximization in Unknown Social Networks Dexun Li, Meghna Lowalekar, Pradeep Varakantham

IJCAI 2021 Learn to Intervene: An Adaptive Learning Policy for Restless Bandits in Application to Preventive Healthcare Arpita Biswas, Gaurav Aggarwal, Pradeep Varakantham, Milind Tambe

JAIR 2021 Zone pAth Construction (ZAC) Based Approaches for Effective Real-Time Ridesharing Meghna Lowalekar, Pradeep Varakantham, Patrick Jaillet

AAAI 2020 Neural Approximate Dynamic Programming for On-Demand Ride-Pooling Sanket Shah, Meghna Lowalekar, Pradeep Varakantham

AAAI 2020 Solving Online Threat Screening Games Using Constrained Action Space Reinforcement Learning Sanket Shah, Arunesh Sinha, Pradeep Varakantham, Andrew Perrault, Milind Tambe

UAI 2019 Correlated Learning for Aggregation Systems Tanvi Verma, Pradeep Varakantham

UAI 2018 Decentralized Planning for Non-Dedicated Agent Teams with Submodular Rewards in Uncertain Environments Pritee Agrawal, Pradeep Varakantham, William Yeoh

AAAI 2018 Dispatch Guided Allocation Optimization for Effective Emergency Response Supriyo Ghosh, Pradeep Varakantham

AAAI 2018 Upping the Game of Taxi Driving in the Age of Uber Shashi Shekhar Jha, Shih-Fen Cheng, Meghna Lowalekar, Nicholas Wong, Rishikeshan Rajendram, Trong Khiem Tran, Pradeep Varakantham, Trong Nghia Truong, Firmansyah Bin Abd Rahman

AAAI 2017 Decentralized Planning in Stochastic Environments with Submodular Rewards Rajiv Ranjan Kumar, Pradeep Varakantham, Akshat Kumar

JAIR 2017 Dynamic Repositioning to Reduce Lost Demand in Bike Sharing Systems Supriyo Ghosh, Pradeep Varakantham, Yossiri Adulyasak, Patrick Jaillet

IJCAI 2017 Mechanism Design for Strategic Project Scheduling Pradeep Varakantham, Na Fu

IJCAI 2017 Proactive and Reactive Coordination of Non-Dedicated Agent Teams Operating in Uncertain Environments Pritee Agrawal, Pradeep Varakantham

JAIR 2017 Sampling Based Approaches for Minimizing Regret in Uncertain Markov Decision Processes (MDPs) Asrar Ahmed, Pradeep Varakantham, Meghna Lowalekar, Yossiri Adulyasak, Patrick Jaillet

AAAI 2016 A Proactive Sampling Approach to Project Scheduling Under Uncertainty Pradeep Varakantham, Na Fu, Hoong Chuin Lau

AAAI 2016 NLU Framework for Voice Enabling Non-Native Applications on Smart Devices Soujanya Lanka, Deepika Pathania, Pooja Kushalappa, Pradeep Varakantham

AAAI 2016 Online Spatio-Temporal Matching in Stochastic and Dynamic Domains Meghna Lowalekar, Pradeep Varakantham, Patrick Jaillet

AAAI 2016 Robust Decision Making for Stochastic Network Design Akshat Kumar, Arambam James Singh, Pradeep Varakantham, Daniel Sheldon

IJCAI 2016 Robust Repositioning to Counter Unpredictable Demand in Bike Sharing Systems Supriyo Ghosh, Michael A. Trick, Pradeep Varakantham

IJCAI 2016 Scalable Greedy Algorithms for Task/Resource Constrained Multi-Agent Stochastic Planning Pritee Agrawal, Pradeep Varakantham, William Yeoh

IJCAI 2016 Sequential Decision Making for Improving Efficiency in Urban Environments Pradeep Varakantham

AAAI 2016 Solving Risk-Sensitive POMDPs with and Without Cost Observations Ping Hou, William Yeoh, Pradeep Varakantham

IJCAI 2015 Probabilistic Inference Based Message-Passing for Resource Constrained DCOPs Supriyo Ghosh, Akshat Kumar, Pradeep Varakantham

AAAI 2015 Risk Based Optimization for Improving Emergency Medical Systems Sandhya Saisubramanian, Pradeep Varakantham, Hoong Chuin Lau

AAAI 2015 Solving Uncertain MDPs with Objectives That Are Separable over Instantiations of Model Uncertainty Yossiri Adulyasak, Pradeep Varakantham, Asrar Ahmed, Patrick Jaillet

AAAI 2014 Decentralized Stochastic Planning with Anonymity in Interactions Pradeep Varakantham, Yossiri Adulyasak, Patrick Jaillet

AAAI 2014 STREETS: Game-Theoretic Traffic Patrolling with Exploration and Exploitation Matthew Brown, Sandhya Saisubramanian, Pradeep Varakantham, Milind Tambe

NeurIPS 2013 Regret Based Robust Solutions for Uncertain Markov Decision Processes Asrar Ahmed, Pradeep Varakantham, Yossiri Adulyasak, Patrick Jaillet

AAAI 2012 Decision Support for Agent Populations in Uncertain and Congested Environments Pradeep Varakantham, Shih-Fen Cheng, Geoffrey J. Gordon, Asrar Ahmed

UAI 2012 Dynamic Stochastic Orienteering Problems for Risk-Aware Applications Hoong Chuin Lau, William Yeoh, Pradeep Varakantham, Duc Thien Nguyen, HuaXing Chen

JAIR 2012 Robust Local Search for Solving RCPSP/max with Durational Uncertainty Na Fu, Hoong Chuin Lau, Pradeep Varakantham, Fei Xiao

UAI 2012 Uncertain Congestion Games with Assorted Human Agent Populations Asrar Ahmed, Pradeep Varakantham, Shih-Fen Cheng

IJCAI 2007 Towards Efficient Computation of Error Bounded Solutions in POMDPs: Expected Value Approximation and Dynamic Disjunctive Beliefs Pradeep Varakantham, Rajiv T. Maheswaran, Tapana Gupta, Milind Tambe

IJCAI 2005 Networked Distributed POMDPs: A Synergy of Distributed Constraint Optimization and POMDPs Ranjit Nair, Pradeep Varakantham, Milind Tambe, Makoto Yokoo

AAAI 2005 Networked Distributed POMDPs: A Synthesis of Distributed Constraint Optimization and POMDPs Ranjit Nair, Pradeep Varakantham, Milind Tambe, Makoto Yokoo