Yang, Linyi

17 publications

ICLR 2025 An Empirical Analysis of Uncertainty in Large Language Model Evaluations Qiujie Xie, Qingqiu Li, Zhuohao Yu, Yuejie Zhang, Yue Zhang, Linyi Yang

NeurIPS 2025 Causal Sufficiency and Necessity Improves Chain-of-Thought Reasoning Xiangning Yu, Zhuohan Wang, Linyi Yang, Haoxuan Li, Anjie Liu, Xiao Xue, Jun Wang, Mengyue Yang

ICLR 2025 CofCA: A STEP-WISE Counterfactual Multi-Hop QA Benchmark Jian Wu, Linyi Yang, Zhen Wang, Manabu Okumura, Yue Zhang

ICML 2025 Constrain Alignment with Sparse Autoencoders Qingyu Yin, Chak Tou Leong, Hongbo Zhang, Minjun Zhu, Hanqi Yan, Qiang Zhang, Yulan He, Wenjie Li, Jun Wang, Yue Zhang, Linyi Yang

ICLR 2025 CycleResearcher: Improving Automated Research via Automated Review Yixuan Weng, Minjun Zhu, Guangsheng Bao, Hongbo Zhang, Jindong Wang, Yue Zhang, Linyi Yang

ICLR 2025 Human Simulacra: Benchmarking the Personification of Large Language Models Qiujie Xie, Qiming Feng, Tianqi Zhang, Qingqiu Li, Linyi Yang, Yuejie Zhang, Rui Feng, Liang He, Shang Gao, Yue Zhang

ICLR 2025 MMQA: Evaluating LLMs with Multi-Table Multi-Hop Complex Questions Jian Wu, Linyi Yang, Dongyuan Li, Yuliang Ji, Manabu Okumura, Yue Zhang

ICLR 2025 Personality Alignment of Large Language Models Minjun Zhu, Yixuan Weng, Linyi Yang, Yue Zhang

NeurIPS 2025 ReMA: Learning to Meta-Think for LLMs with Multi-Agent Reinforcement Learning Ziyu Wan, Yunxiang Li, Xiaoyu Wen, Yan Song, Hanjing Wang, Linyi Yang, Mark Schmidt, Jun Wang, Weinan Zhang, Shuyue Hu, Ying Wen

NeurIPS 2025 ThinkBench: Dynamic Out-of-Distribution Evaluation for Robust LLM Reasoning Shulin Huang, Linyi Yang, Yan Song, Shuang Chen, Leyang Cui, Ziyu Wan, Qingcheng Zeng, Ying Wen, Kun Shao, Weinan Zhang, Jun Wang, Yue Zhang

NeurIPS 2024 CulturePark: Boosting Cross-Cultural Understanding in Large Language Models Cheng Li, Damien Teney, Linyi Yang, Qingsong Wen, Xing Xie, Jindong Wang

ICLR 2024 Fast-DetectGPT: Efficient Zero-Shot Detection of Machine-Generated Text via Conditional Probability Curvature Guangsheng Bao, Yanbin Zhao, Zhiyang Teng, Linyi Yang, Yue Zhang

ICLR 2024 PandaLM: An Automatic Evaluation Benchmark for LLM Instruction Tuning Optimization Yidong Wang, Zhuohao Yu, Wenjin Yao, Zhengran Zeng, Linyi Yang, Cunxiang Wang, Hao Chen, Chaoya Jiang, Rui Xie, Jindong Wang, Xing Xie, Wei Ye, Shikun Zhang, Yue Zhang

ICLR 2024 Supervised Knowledge Makes Large Language Models Better In-Context Learners Linyi Yang, Shuibai Zhang, Zhuohao Yu, Guangsheng Bao, Yidong Wang, Jindong Wang, Ruochen Xu, Wei Ye, Xing Xie, Weizhu Chen, Yue Zhang

ICLRW 2023 On the Robustness of ChatGPT: An Adversarial and Out-of-Distribution Perspective Jindong Wang, Xixu Hu, Wenxin Hou, Hao Chen, Runkai Zheng, Yidong Wang, Linyi Yang, Wei Ye, Haojun Huang, Xiubo Geng, Binxing Jiao, Yue Zhang, Xing Xie

AAAI 2022 NumHTML: Numeric-Oriented Hierarchical Transformer Model for Multi-Task Financial Forecasting Linyi Yang, Jiazheng Li, Ruihai Dong, Yue Zhang, Barry Smyth

NeurIPS 2022 USB: A Unified Semi-Supervised Learning Benchmark for Classification Yidong Wang, Hao Chen, Yue Fan, Wang Sun, Ran Tao, Wenxin Hou, Renjie Wang, Linyi Yang, Zhi Zhou, Lan-Zhe Guo, Heli Qi, Zhen Wu, Yu-Feng Li, Satoshi Nakamura, Wei Ye, Marios Savvides, Bhiksha Raj, Takahiro Shinozaki, Bernt Schiele, Jindong Wang, Xing Xie, Yue Zhang