Planning in Discrete and Continuous Markov Decision Processes by Probabilistic Programming

Nitti, Davide; Belle, Vaishak; De Raedt, Luc

doi:10.1007/978-3-319-23525-7_20

Planning in Discrete and Continuous Markov Decision Processes by Probabilistic Programming

Davide Nitti, Vaishak Belle, Luc De Raedt

ECML-PKDD 2015 pp. 327-342

doi:10.1007/978-3-319-23525-7_20 /ecmlpkdd/2015/nitti2015ecmlpkdd-planning/

Abstract

Real-world planning problems frequently involve mixtures of continuous and discrete state variables and actions, and are formulated in environments with an unknown number of objects. In recent years, probabilistic programming has emerged as a natural approach to capture and characterize such complex probability distributions with general-purpose inference methods. While it is known that a probabilistic programming language can be easily extended to represent Markov Decision Processes (MDPs) for planning tasks, solving such tasks is challenging. Building on related efforts in reinforcement learning, we introduce a conceptually simple but powerful planning algorithm for MDPs realized as a probabilistic program. This planner constructs approximations to the optimal policy by importance sampling, while exploiting the knowledge of the MDP model. In our empirical evaluations, we show that this approach has wide applicability on domains ranging from strictly discrete to strictly continuous to hybrid ones, handles intricacies such as unknown objects, and is argued to be competitive given its generality.

PDF ECML-PKDD Semantic Scholar

Cite

Text

Nitti et al. "Planning in Discrete and Continuous Markov Decision Processes by Probabilistic Programming." European Conference on Machine Learning and Principles and Practice of Knowledge Discovery in Databases, 2015. doi:10.1007/978-3-319-23525-7_20

Markdown

[Nitti et al. "Planning in Discrete and Continuous Markov Decision Processes by Probabilistic Programming." European Conference on Machine Learning and Principles and Practice of Knowledge Discovery in Databases, 2015.](https://mlanthology.org/ecmlpkdd/2015/nitti2015ecmlpkdd-planning/) doi:10.1007/978-3-319-23525-7_20

BibTeX

@inproceedings{nitti2015ecmlpkdd-planning,
  title     = {{Planning in Discrete and Continuous Markov Decision Processes by Probabilistic Programming}},
  author    = {Nitti, Davide and Belle, Vaishak and De Raedt, Luc},
  booktitle = {European Conference on Machine Learning and Principles and Practice of Knowledge Discovery in Databases},
  year      = {2015},
  pages     = {327-342},
  doi       = {10.1007/978-3-319-23525-7_20},
  url       = {https://mlanthology.org/ecmlpkdd/2015/nitti2015ecmlpkdd-planning/}
}