Ma, Dingli

1 publications

JMLR 2024 Instrumental Variable Value Iteration for Causal Offline Reinforcement Learning Luofeng Liao, Zuyue Fu, Zhuoran Yang, Yixin Wang, Dingli Ma, Mladen Kolar, Zhaoran Wang