Cho, Seong Hah

2 publications

ICLRW 2025 The Steganographic Potentials of Language Models Artem Karpov, Tinuade Adeleke, Seong Hah Cho, Natalia Perez-Campanero

NeurIPSW 2024 Inducing Human-like Biases in Moral Reasoning Language Models Austin Meek, Artem Karpov, Seong Hah Cho, Raymond Koopmanschap, Lucy Farnik, Bogdan-Ionut Cirstea