Rosenberg, Aviv

20 publications

JMLR 2025 A Unified Analysis of Nonstochastic Delayed Feedback for Combinatorial Semi-Bandits, Linear Bandits, and MDPs Lukas Zierahn, Dirk van der Hoeven, Tal Lancewicki, Aviv Rosenberg, Nicolò Cesa-Bianchi

ICLR 2025 Building Math Agents with Multi-Turn Iterative Preference Learning Wei Xiong, Chengshuai Shi, Jiaming Shen, Aviv Rosenberg, Zhen Qin, Daniele Calandriello, Misha Khalman, Rishabh Joshi, Bilal Piot, Mohammad Saleh, Chi Jin, Tong Zhang, Tianqi Liu

NeurIPS 2024 Multi-Turn Reinforcement Learning with Preference Human Feedback Lior Shani, Aviv Rosenberg, Asaf Cassel, Oran Lang, Daniele Calandriello, Avital Zipori, Hila Noga, Orgad Keller, Bilal Piot, Idan Szpektor, Avinatan Hassidim, Yossi Matias, Rémi Munos

ICML 2024 Near-Optimal Regret in Linear MDPs with Aggregate Bandit Feedback Asaf Cassel, Haipeng Luo, Aviv Rosenberg, Dmitry Sotnikov

NeurIPS 2024 Online Weighted Paging with Unknown Weights Orin Levy, Noam Touitou, Aviv Rosenberg

NeurIPS 2024 Warm-up Free Policy Optimization: Improved Regret in Linear Markov Decision Processes Asaf Cassel, Aviv Rosenberg

COLT 2023 A Unified Analysis of Nonstochastic Delayed Feedback for Combinatorial Semi-Bandits, Linear Bandits, and MDPs Dirk Hoeven, Lukas Zierahn, Tal Lancewicki, Aviv Rosenberg, Nicolò Cesa-Bianchi

ICML 2023 Delay-Adapted Policy Optimization and Improved Regret for Adversarial MDP with Delayed Bandit Feedback Tal Lancewicki, Aviv Rosenberg, Dmitry Sotnikov

AAAI 2023 Planning and Learning with Adaptive Lookahead Aviv Rosenberg, Assaf Hallak, Shie Mannor, Gal Chechik, Gal Dalal

ICML 2022 Cooperative Online Learning in Stochastic and Adversarial MDPs Tal Lancewicki, Aviv Rosenberg, Yishay Mansour

AAAI 2022 Learning Adversarial Markov Decision Processes with Delayed Feedback Tal Lancewicki, Aviv Rosenberg, Yishay Mansour

NeurIPS 2022 Near-Optimal Regret for Adversarial MDP with Delayed Bandit Feedback Tiancheng Jin, Tal Lancewicki, Haipeng Luo, Yishay Mansour, Aviv Rosenberg

COLT 2022 Policy Optimization for Stochastic Shortest Path Liyu Chen, Haipeng Luo, Aviv Rosenberg

NeurIPS 2021 Minimax Regret for Stochastic Shortest Path Alon Cohen, Yonathan Efroni, Yishay Mansour, Aviv Rosenberg

NeurIPS 2021 Oracle-Efficient Regret Minimization in Factored MDPs with Unknown Structure Aviv Rosenberg, Yishay Mansour

IJCAI 2021 Stochastic Shortest Path with Adversarially Changing Costs Aviv Rosenberg, Yishay Mansour

ICML 2020 Near-Optimal Regret Bounds for Stochastic Shortest Path Aviv Rosenberg, Alon Cohen, Yishay Mansour, Haim Kaplan

ICML 2020 Optimistic Policy Optimization with Bandit Feedback Lior Shani, Yonathan Efroni, Aviv Rosenberg, Shie Mannor

ICML 2019 Online Convex Optimization in Adversarial Markov Decision Processes Aviv Rosenberg, Yishay Mansour

NeurIPS 2019 Online Stochastic Shortest Path with Bandit Feedback and Unknown Transition Function Aviv Rosenberg, Yishay Mansour