Torop, Max

4 publications

AISTATS 2025 Axiomatic Explainer Globalness via Optimal Transport Davin Hill, Joshua Bone, Aria Masoomi, Max Torop, Jennifer Dy

NeurIPS 2025 DISCO: Disentangled Communication Steering for Large Language Models Max Torop, Aria Masoomi, Masih Eskandar, Jennifer Dy

AISTATS 2024 Boundary-Aware Uncertainty for Feature Attribution Explainers Davin Hill, Aria Masoomi, Max Torop, Sandesh Ghimire, Jennifer Dy

NeurIPS 2023 SmoothHess: ReLU Network Feature Interactions via Stein's Lemma Max Torop, Aria Masoomi, Davin Hill, Kivanc Kose, Stratis Ioannidis, Jennifer Dy