Wang, Sid

6 publications

ICLR 2026 Prompt Curriculum Learning for Efficient LLM Post-Training Zhaolin Gao, Joongwon Kim, Wen Sun, Thorsten Joachims, Sid Wang, Richard Yuanzhe Pang, Liang Tan

ICLR 2026 SPG: Sandwiched Policy Gradient for Masked Diffusion Language Models Chenyu Wang, Paria Rashidinejad, DiJia Su, Song Jiang, Sid Wang, Siyan Zhao, Cai Zhou, Shannon Zejiang Shen, Feiyu Chen, Tommi Jaakkola, Yuandong Tian, Bo Liu

ICLR 2026 The Alignment Waltz: Jointly Training Agents to Collaborate for Safety Jingyu Zhang, Haozhu Wang, Eric Michael Smith, Sid Wang, Amr Sharaf, Mahesh Pasupuleti, Benjamin Van Durme, Daniel Khashabi, Jason E Weston, Hongyuan Zhan

NeurIPS 2025 Beyond Verifiable Rewards: Scaling Reinforcement Learning in Language Models to Unverifiable Data Yunhao Tang, Sid Wang, Lovish Madaan, Remi Munos

ICLRW 2023 Privately Customizing Prefinetuning to Better Match User Data in Federated Learning Charlie Hou, Hongyuan Zhan, Akshat Shrivastava, Sid Wang, Aleksandr Livshits, Giulia Fanti, Daniel Lazar

NeurIPSW 2023 READ: Recurrent Adaptation of Large Transformers Sid Wang, John Nguyen, Ke Li, Carole-Jean Wu