Option Discovery Using Deep Skill Chaining

Bagaria, Akhil; Konidaris, George

Option Discovery Using Deep Skill Chaining

ICLR 2020

/iclr/2020/bagaria2020iclr-option/

Abstract

Autonomously discovering temporally extended actions, or skills, is a longstanding goal of hierarchical reinforcement learning. We propose a new algorithm that combines skill chaining with deep neural networks to autonomously discover skills in high-dimensional, continuous domains. The resulting algorithm, deep skill chaining, constructs skills with the property that executing one enables the agent to execute another. We demonstrate that deep skill chaining significantly outperforms both non-hierarchical agents and other state-of-the-art skill discovery techniques in challenging continuous control tasks.

PDF ICLR Semantic Scholar

Cite

Text

Bagaria and Konidaris. "Option Discovery Using Deep Skill Chaining." International Conference on Learning Representations, 2020.

Markdown

[Bagaria and Konidaris. "Option Discovery Using Deep Skill Chaining." International Conference on Learning Representations, 2020.](https://mlanthology.org/iclr/2020/bagaria2020iclr-option/)

BibTeX

@inproceedings{bagaria2020iclr-option,
  title     = {{Option Discovery Using Deep Skill Chaining}},
  author    = {Bagaria, Akhil and Konidaris, George},
  booktitle = {International Conference on Learning Representations},
  year      = {2020},
  url       = {https://mlanthology.org/iclr/2020/bagaria2020iclr-option/}
}