Polo, Felipe Maia

14 publications

ICLR 2025 A Transfer Learning Framework for Weak to Strong Generalization Seamus Somerstep, Felipe Maia Polo, Moulinath Banerjee, Yaacov Ritov, Mikhail Yurochkin, Yuekai Sun

NeurIPS 2025 Bridging Human and LLM Judgments: Understanding and Narrowing the Gap Felipe Maia Polo, Xinhe Wang, Mikhail Yurochkin, Gongjun Xu, Moulinath Banerjee, Yuekai Sun

ICLRW 2025 CARROT: A Cost Aware Rate Optimal Router Seamus Somerstep, Felipe Maia Polo, Allysson Flavio Melo de Oliveira, Prattyush Mangal, Mírian Silva, Onkar Bhardwaj, Mikhail Yurochkin, Subha Maity

ICLR 2025 LiveXiv - A Multi-Modal Live Benchmark Based on arXiv Papers Content Nimrod Shabtay, Felipe Maia Polo, Sivan Doveh, Wei Lin, Muhammad Jehanzeb Mirza, Leshem Choshen, Mikhail Yurochkin, Yuekai Sun, Assaf Arbelle, Leonid Karlinsky, Raja Giryes

AISTATS 2025 Microfoundation Inference for Strategic Prediction Daniele Bracale, Subha Maity, Felipe Maia Polo, Seamus Somerstep, Moulinath Banerjee, Yuekai Sun

NeurIPS 2025 Sloth: Scaling Laws for LLM Skills to Predict Multi-Benchmark Performance Across Families Felipe Maia Polo, Seamus Somerstep, Leshem Choshen, Yuekai Sun, Mikhail Yurochkin

ICMLW 2024 A Statistical Framework for Weak-to-Strong Generalization Seamus Somerstep, Felipe Maia Polo, Moulinath Banerjee, Yaacov Ritov, Mikhail Yurochkin, Yuekai Sun

NeurIPS 2024 Efficient Multi-Prompt Evaluation of LLMs Felipe Maia Polo, Ronald Xu, Lucas Weber, Mírian Silva, Onkar Bhardwaj, Leshem Choshen, Allysson Flavio Melo de Oliveira, Yuekai Sun, Mikhail Yurochkin

ICMLW 2024 Efficient Multi-Prompt Evaluation of LLMs Felipe Maia Polo, Ronald Xu, Lucas Weber, Mírian Silva, Onkar Bhardwaj, Leshem Choshen, Allysson Flavio Melo de Oliveira, Yuekai Sun, Mikhail Yurochkin

ICLR 2024 Fusing Models with Complementary Expertise Hongyi Wang, Felipe Maia Polo, Yuekai Sun, Souvik Kundu, Eric Xing, Mikhail Yurochkin

NeurIPS 2024 Weak Supervision Performance Evaluation via Partial Identification Felipe Maia Polo, Subha Maity, Mikhail Yurochkin, Moulinath Banerjee, Yuekai Sun

NeurIPS 2023 Conditional Independence Testing Under Misspecified Inductive Biases Felipe Maia Polo, Yuekai Sun, Moulinath Banerjee

NeurIPSW 2023 Estimating Fréchet Bounds for Validating Programmatic Weak Supervision Felipe Maia Polo, Mikhail Yurochkin, Moulinath Banerjee, Subha Maity, Yuekai Sun

NeurIPSW 2023 Fusing Models with Complementary Expertise Hongyi Wang, Felipe Maia Polo, Yuekai Sun, Souvik Kundu, Eric P. Xing, Mikhail Yurochkin