Marquez, Matthew

4 publications

NeurIPSW 2023 Can Large Language Models Really Improve by Self-Critiquing Their Own Plans? Karthik Valmeekam, Matthew Marquez, Subbarao Kambhampati

NeurIPSW 2023 GPT-4 Doesn’t Know It’s Wrong: An Analysis of Iterative Prompting for Reasoning Problems Kaya Stechly, Matthew Marquez, Subbarao Kambhampati

NeurIPS 2023 On the Planning Abilities of Large Language Models - A Critical Investigation Karthik Valmeekam, Matthew Marquez, Sarath Sreedharan, Subbarao Kambhampati

NeurIPS 2023 PlanBench: An Extensible Benchmark for Evaluating Large Language Models on Planning and Reasoning About Change Karthik Valmeekam, Matthew Marquez, Alberto Olmo, Sarath Sreedharan, Subbarao Kambhampati