Lee, Ji-Ung

2 publications

ICLR 2026 Bridging Fairness and Explainability: Can Input-Based Explanations Promote Fairness in Hate Speech Detection? Yifan Wang, Mayank Jobanputra, Ji-Ung Lee, Soyoung Oh, Isabel Valera, Vera Demberg

TMLR 2025 B-Cos LM: Efficiently Transforming Pre-Trained Language Models for Improved Explainability Yifan Wang, Sukrut Rao, Ji-Ung Lee, Mayank Jobanputra, Vera Demberg