Rashidinejad, Paria

8 publications

ICLR 2026 SPG: Sandwiched Policy Gradient for Masked Diffusion Language Models Chenyu Wang, Paria Rashidinejad, DiJia Su, Song Jiang, Sid Wang, Siyan Zhao, Cai Zhou, Shannon Zejiang Shen, Feiyu Chen, Tommi Jaakkola, Yuandong Tian, Bo Liu

ICLR 2025 Sail into the Headwind: Alignment via Robust Rewards and Dynamic Labels Against Reward Hacking Paria Rashidinejad, Yuandong Tian

NeurIPS 2023 Importance Weighted Actor-Critic for Optimal Conservative Offline Reinforcement Learning Hanlin Zhu, Paria Rashidinejad, Jiantao Jiao

ICMLW 2023 Importance Weighted Actor-Critic for Optimal Conservative Offline Reinforcement Learning Hanlin Zhu, Paria Rashidinejad, Jiantao Jiao

ICLR 2023 Optimal Conservative Offline RL with General Function Approximation via Augmented Lagrangian Paria Rashidinejad, Hanlin Zhu, Kunhe Yang, Stuart Russell, Jiantao Jiao

NeurIPS 2021 Bridging Offline Reinforcement Learning and Imitation Learning: A Tale of Pessimism Paria Rashidinejad, Banghua Zhu, Cong Ma, Jiantao Jiao, Stuart J. Russell

NeurIPS 2021 MADE: Exploration via Maximizing Deviation from Explored Regions Tianjun Zhang, Paria Rashidinejad, Jiantao Jiao, Yuandong Tian, Joseph E Gonzalez, Stuart J. Russell

NeurIPS 2020 SLIP: Learning to Predict in Unknown Dynamical Systems with Long-Term Memory Paria Rashidinejad, Jiantao Jiao, Stuart J. Russell