Shieh, Michael

6 publications

ICLR 2025 LongPO: Long Context Self-Evolution of Large Language Models Through Short-to-Long Preference Optimization Guanzheng Chen, Xin Li, Michael Shieh, Lidong Bing

ICLR 2025 MixEval-X: Any-to-Any Evaluations from Real-World Data Mixture Jinjie Ni, Yifan Song, Deepanway Ghosal, Bo Li, David Junhao Zhang, Xiang Yue, Fuzhao Xue, Yuntian Deng, Zian Zheng, Kaichen Zhang, Mahir Shah, Kabir Jain, Yang You, Michael Shieh

AAAI 2025 Single Character Perturbations Break LLM Alignment Leon Lin, Hannah Brown, Kenji Kawaguchi, Michael Shieh

ICLR 2025 Understanding and Enhancing Safety Mechanisms of LLMs via Safety-Specific Neuron Yiran Zhao, Wenxuan Zhang, Yuxi Xie, Anirudh Goyal, Kenji Kawaguchi, Michael Shieh

NeurIPSW 2024 Advancing Adversarial Suffix Transfer Learning on Aligned Large Language Models Hongfu Liu, Yuxi Xie, Ye Wang, Michael Shieh

NeurIPSW 2024 Monte Carlo Tree Search Boosts Reasoning via Iterative Preference Learning Yuxi Xie, Anirudh Goyal, Wenyue Zheng, Min-Yen Kan, Timothy P Lillicrap, Kenji Kawaguchi, Michael Shieh