Hua, Tim Tian

2 publications

ICLR 2026 Steering Evaluation-Aware Language Models to Act like They Are Deployed Tim Tian Hua, Andrew Qin, Samuel Marks, Neel Nanda

NeurIPS 2025 Combining Cost Constrained Runtime Monitors for AI Safety Tim Tian Hua, James Baskerville, Henri Lemoine, Mia Hopman, Aryan Bhatt, Tyler Tracy