Efroni, Yonathan

38 publications

ICML 2025 Aligned Multi Objective Optimization Yonathan Efroni, Ben Kretzu, Daniel R. Jiang, Jalaj Bhandari, Zheqing Zhu, Karen Ullrich

ICLR 2025 Exploiting Structure in Offline Multi-Agent RL: The Benefits of Low Interaction Rank Wenhao Zhan, Scott Fujimoto, Zheqing Zhu, Jason D. Lee, Daniel Jiang, Yonathan Efroni

ICLR 2025 Time After Time: Deep-Q Effect Estimation for Interventions on When and What to Do Yoav Wald, Mark Goldstein, Yonathan Efroni, Wouter A.C. van Amsterdam, Rajesh Ranganath

NeurIPSW 2024 Aligned Multi-Objective Optimization Yonathan Efroni, Daniel Jiang, Ben Kretzu, Jalaj Bhandari, Zheqing Zhu, Karen Ullrich

NeurIPSW 2024 Dueling in the Dark: An Efficient and Optimal Mirror Descent Approach for Online Optimization with Adversarial Preferences Aadirupa Saha, Yonathan Efroni, Barry-John Theobald

ICML 2024 PcLast: Discovering Plannable Continuous Latent States Anurag Koul, Shivakanth Sujit, Shaoru Chen, Ben Evans, Lili Wu, Byron Xu, Rajan Chari, Riashat Islam, Raihan Seraj, Yonathan Efroni, Lekan P Molu, Miroslav Dudı́k, John Langford, Alex Lamb

MLOSS 2024 Pearl: A Production-Ready Reinforcement Learning Agent Zheqing Zhu, Rodrigo de Salvo Braz, Jalaj Bhandari, Daniel Jiang, Yi Wan, Yonathan Efroni, Liyuan Wang, Ruiyang Xu, Hongbo Guo, Alex Nikulkov, Dmytro Korenkevych, Urun Dogan, Frank Cheng, Zheng Wu, Wanqiao Xu

ICML 2024 Prospective Side Information for Latent MDPs Jeongyeol Kwon, Yonathan Efroni, Shie Mannor, Constantine Caramanis

NeurIPS 2024 RL in Latent MDPs Is Tractable: Online Guarantees via Off-Policy Evaluation Jeongyeol Kwon, Shie Mannor, Constantine Caramanis, Yonathan Efroni

ICLRW 2024 The Bias of Harmful Label Associations in Vision-Language Models Caner Hazirbas, Alicia Yi Sun, Yonathan Efroni, Mark Ibrahim

NeurIPSW 2023 Agent-Centric State Discovery for Finite-Memory POMDPs Lili Wu, Ben Evans, Riashat Islam, Raihan Seraj, Yonathan Efroni, Alex Lamb

TMLR 2023 Guaranteed Discovery of Control-Endogenous Latent States with Multi-Step Inverse Models Alex Lamb, Riashat Islam, Yonathan Efroni, Aniket Rajiv Didolkar, Dipendra Misra, Dylan J Foster, Lekan P Molu, Rajan Chari, Akshay Krishnamurthy, John Langford

ICML 2023 Principled Offline RL in the Presence of Rich Exogenous Information Riashat Islam, Manan Tomar, Alex Lamb, Yonathan Efroni, Hongyu Zang, Aniket Rajiv Didolkar, Dipendra Misra, Xin Li, Harm Van Seijen, Remi Tachet Des Combes, John Langford

ICML 2023 Reward-Mixing MDPs with Few Latent Contexts Are Learnable Jeongyeol Kwon, Yonathan Efroni, Constantine Caramanis, Shie Mannor

NeurIPSW 2022 Agent-Controller Representations: Principled Offline RL with Rich Exogenous Information Riashat Islam, Manan Tomar, Alex Lamb, Hongyu Zang, Yonathan Efroni, Dipendra Misra, Aniket Rajiv Didolkar, Xin Li, Harm van Seijen, Remi Tachet des Combes, John Langford

ICML 2022 Coordinated Attacks Against Contextual Bandits: Fundamental Limits and Defense Mechanisms Jeongyeol Kwon, Yonathan Efroni, Constantine Caramanis, Shie Mannor

ICLR 2022 Mirror Descent Policy Optimization Manan Tomar, Lior Shani, Yonathan Efroni, Mohammad Ghavamzadeh

ICML 2022 Provable Reinforcement Learning with a Short-Term Memory Yonathan Efroni, Chi Jin, Akshay Krishnamurthy, Sobhan Miryoosefi

ICLR 2022 Provably Filtering Exogenous Distractors Using Multistep Inverse Dynamics Yonathan Efroni, Dipendra Misra, Akshay Krishnamurthy, Alekh Agarwal, John Langford

COLT 2022 Sample-Efficient Reinforcement Learning in the Presence of Exogenous Information Yonathan Efroni, Dylan J Foster, Dipendra Misra, Akshay Krishnamurthy, John Langford

ICML 2022 Sparsity in Partially Controllable Linear Systems Yonathan Efroni, Sham Kakade, Akshay Krishnamurthy, Cyril Zhang

NeurIPS 2022 Tractable Optimality in Episodic Latent MABs Jeongyeol Kwon, Yonathan Efroni, Constantine Caramanis, Shie Mannor

UAI 2021 Bandits with Partially Observable Confounded Data Guy Tennenholtz, Uri Shalit, Shie Mannor, Yonathan Efroni

ICML 2021 Confidence-Budget Matching for Sequential Budgeted Learning Yonathan Efroni, Nadav Merlis, Aadirupa Saha, Shie Mannor

NeurIPS 2021 Minimax Regret for Stochastic Shortest Path Alon Cohen, Yonathan Efroni, Yishay Mansour, Aviv Rosenberg

NeurIPS 2021 RL for Latent MDPs: Regret Guarantees and a Lower Bound Jeongyeol Kwon, Yonathan Efroni, Constantine Caramanis, Shie Mannor

NeurIPS 2021 Reinforcement Learning in Reward-Mixing MDPs Jeongyeol Kwon, Yonathan Efroni, Constantine Caramanis, Shie Mannor

AAAI 2021 Reinforcement Learning with Trajectory Feedback Yonathan Efroni, Nadav Merlis, Shie Mannor

AAAI 2020 Adaptive Trust Region Policy Optimization: Global Convergence and Faster Rates for Regularized MDPs Lior Shani, Yonathan Efroni, Shie Mannor

ICML 2020 Multi-Step Greedy Reinforcement Learning Algorithms Manan Tomar, Yonathan Efroni, Mohammad Ghavamzadeh

NeurIPS 2020 Online Planning with Lookahead Policies Yonathan Efroni, Mohammad Ghavamzadeh, Shie Mannor

ICML 2020 Optimistic Policy Optimization with Bandit Feedback Lior Shani, Yonathan Efroni, Aviv Rosenberg, Shie Mannor

ICML 2019 Action Robust Reinforcement Learning and Applications in Continuous Control Chen Tessler, Yonathan Efroni, Shie Mannor

ICML 2019 Exploration Conscious Reinforcement Learning Revisited Lior Shani, Yonathan Efroni, Shie Mannor

AAAI 2019 How to Combine Tree-Search Methods in Reinforcement Learning Yonathan Efroni, Gal Dalal, Bruno Scherrer, Shie Mannor

NeurIPS 2019 Tight Regret Bounds for Model-Based Reinforcement Learning with Greedy Policies Yonathan Efroni, Nadav Merlis, Mohammad Ghavamzadeh, Shie Mannor

ICML 2018 Beyond the One-Step Greedy Approach in Reinforcement Learning Yonathan Efroni, Gal Dalal, Bruno Scherrer, Shie Mannor

NeurIPS 2018 Multiple-Step Greedy Policies in Approximate and Online Reinforcement Learning Yonathan Efroni, Gal Dalal, Bruno Scherrer, Shie Mannor