Wu, Chien-Sheng

13 publications

TMLR 2026 CRMArena-Pro: Holistic Assessment of LLM Agents Across Diverse Business Scenarios and Interactions Kung-Hsiang Huang, Akshara Prabhakar, Onkar Thorat, Divyansh Agarwal, Prafulla Kumar Choubey, Yixin Mao, Silvio Savarese, Caiming Xiong, Chien-Sheng Wu

ICLR 2026 DeepTRACE: Auditing Deep Research AI Systems for Tracking Reliability Across Citations and Evidence Pranav Narayanan Venkit, Philippe Laban, Yilun Zhou, Kung-Hsiang Huang, Yixin Mao, Chien-Sheng Wu

ICLR 2026 Foundational Automatic Evaluators: Scaling Multi-Task Generative Evaluator Training for Reasoning-Centric Domains Austin Xu, Xuan-Phi Nguyen, Yilun Zhou, Chien-Sheng Wu, Caiming Xiong, Shafiq Joty

ICLR 2026 Nudging the Boundaries of LLM Reasoning Justin Chen, Xiangyu Peng, Prafulla Kumar Choubey, Kung-Hsiang Huang, Jiaxin Zhang, Mohit Bansal, Chien-Sheng Wu

ICLR 2026 Scaling Knowledge Graph Construction Through Synthetic Data Generation and Distillation Prafulla Kumar Choubey, Xin Su, Man Luo, Xiangyu Peng, Caiming Xiong, Tiep Le, Shachar Rosenman, Vasudev Lal, Phil L Mui, Ricky Ho, Phillip Howard, Chien-Sheng Wu

ICLR 2025 BingoGuard: LLM Content Moderation Tools with Risk Levels Fan Yin, Philippe Laban, Xiangyu Peng, Yilun Zhou, Yixin Mao, Vaibhav Vats, Linnea Ross, Divyansh Agarwal, Caiming Xiong, Chien-Sheng Wu

ICLR 2025 ReGenesis: LLMs Can Grow into Reasoning Generalists via Self-Improvement Xiangyu Peng, Congying Xia, Xinyi Yang, Caiming Xiong, Chien-Sheng Wu, Chen Xing

TMLR 2025 Shared Imagination: LLMs Hallucinate Alike Yilun Zhou, Caiming Xiong, Silvio Savarese, Chien-Sheng Wu

ICLR 2025 SiReRAG: Indexing Similar and Related Information for Multihop Reasoning Nan Zhang, Prafulla Kumar Choubey, Alexander Fabbri, Gabriel Bernadett-Shapiro, Rui Zhang, Prasenjit Mitra, Caiming Xiong, Chien-Sheng Wu

ICLR 2023 Model Ensemble Instead of Prompt Fusion: A Sample-Specific Knowledge Transfer Method for Few-Shot Prompt Tuning Xiangyu Peng, Chen Xing, Prafulla Kumar Choubey, Chien-Sheng Wu, Caiming Xiong

ICLR 2021 GraPPa: Grammar-Augmented Pre-Training for Table Semantic Parsing Tao Yu, Chien-Sheng Wu, Xi Victoria Lin, Bailin Wang, Yi Chern Tan, Xinyi Yang, Dragomir Radev, Richard Socher, Caiming Xiong

NeurIPS 2020 A Simple Language Model for Task-Oriented Dialogue Ehsan Hosseini-Asl, Bryan McCann, Chien-Sheng Wu, Semih Yavuz, Richard Socher

ICLR 2019 Global-to-Local Memory Pointer Networks for Task-Oriented Dialogue Chien-Sheng Wu, Richard Socher, Caiming Xiong