Olmo, Alberto

2 publications

NeurIPS 2023 PlanBench: An Extensible Benchmark for Evaluating Large Language Models on Planning and Reasoning About Change Karthik Valmeekam, Matthew Marquez, Alberto Olmo, Sarath Sreedharan, Subbarao Kambhampati

NeurIPSW 2022 Large Language Models Still Can't Plan (a Benchmark for LLMs on Planning and Reasoning About Change) Karthik Valmeekam, Alberto Olmo, Sarath Sreedharan, Subbarao Kambhampati