Kang, Zhewei

2 publications

ICLR 2026 Learning to Reason Without External Rewards Xuandong Zhao, Zhewei Kang, Aosong Feng, Sergey Levine, Dawn Song

NeurIPS 2025 Scalable Best-of-N Selection for Large Language Models via Self-Certainty Zhewei Kang, Xuandong Zhao, Dawn Song