Wang, Shijin

27 publications

ICLR 2026 ChemEval: A Multi-Level and Fine-Grained Chemical Capability Evaluation for Large Language Models Yuqing Huang, Rongyang Zhang, Xuesong He, Xuyang Zhi, Hao Wang, Nuo Chen, Zongbo Liu, Xin Li, Feiyang Xu, Deguang Liu, Huadong Liang, YiLi, Jian Cui, Yin Xu, Shijin Wang, Qi Liu, Defu Lian, Guiquan Liu, Enhong Chen

ICLR 2026 Fewer Battles, More Gain: An Information-Efficient Framework for Arena-Based LLM Evaluation Zirui Liu, Xianquan Wang, Yan Zhuang, Jiatong Li, Qi Liu, Shuanghong Shen, Mingyue Cheng, Shijin Wang

NeurIPS 2025 A Closed-Form Solution for Fast and Reliable Adaptive Testing Yan Zhuang, Chenye Ke, Zirui Liu, Qi Liu, Yuting Ning, Zhenya Huang, Weizhe Huang, Qingyang Mao, Shijin Wang

ICML 2025 Am-ELO: A Stable Framework for Arena-Based LLM Evaluation Zirui Liu, Jiatong Li, Yan Zhuang, Qi Liu, Shuanghong Shen, Jie Ouyang, Mingyue Cheng, Shijin Wang

ICML 2025 CogMath: Assessing LLMs’ Authentic Mathematical Ability from a Human Cognitive Perspective Jiayu Liu, Zhenya Huang, Wei Dai, Cheng Cheng, Jinze Wu, Jing Sha, Song Li, Qi Liu, Shijin Wang, Enhong Chen

ICML 2025 CursorCore: Assist Programming Through Aligning Anything Hao Jiang, Qi Liu, Rui Li, Shengyu Ye, Shijin Wang

ICML 2025 Evaluating LLMs Across Multi-Cognitive Levels: From Medical Knowledge Mastery to Scenario-Based Problem Solving Yuxuan Zhou, Xien Liu, Chenwei Yan, Chen Ning, Xiao Zhang, Boxun Li, Xiangling Fu, Shijin Wang, Guoping Hu, Yu Wang, Ji Wu

ICLR 2025 Evaluating Large Language Models Through Role-Guide and Self-Reflection: A Comparative Study Lili Zhao, Yang Wang, Qi Liu, Mengyun Wang, Wei Chen, Zhichao Sheng, Shijin Wang

NeurIPS 2025 FACT: Mitigating Inconsistent Hallucinations in LLMs via Fact-Driven Alternating Code-Text Training Xinxin You, Qixin Sun, Chenwei Yan, Xiao Zhang, Chen Ning, Xiangling Fu, Si Liu, Guoping Hu, Shijin Wang, Ji Wu, Xien Liu

NeurIPS 2025 How Does Sequence Modeling Architecture Influence Base Capabilities of Pre-Trained Language Models? Exploring Key Architecture Design Principles to Avoid Base Capabilities Degradation Xin Lu, Yanyan Zhao, Si Wei, Shijin Wang, Bing Qin, Ting Liu

NeurIPS 2025 Investigating and Mitigating Catastrophic Forgetting in Medical Knowledge Injection Through Internal Knowledge Augmentation Learning Yuxuan Zhou, Xien Liu, Xiao Zhang, Chen Ning, Shijin Wang, Guoping Hu, Ji Wu

AAAI 2025 Multi-Perspective Consolidation Enhanced Cognitive Diagnosis via Conditional Diffusion Model Guanhao Zhao, Zhenya Huang, Cheng Cheng, Yan Zhuang, Qingyang Mao, Xin Li, Shijin Wang, Enhong Chen

ICML 2025 Position: AI Evaluation Should Learn from How We Test Humans Yan Zhuang, Qi Liu, Zachary Pardos, Patrick C. Kyllonen, Jiyun Zu, Zhenya Huang, Shijin Wang, Enhong Chen

AAAI 2024 CONSIDER: Commonalities and Specialties Driven Multilingual Code Retrieval Framework Rui Li, Liyang He, Qi Liu, Yuze Zhao, Zheng Zhang, Zhenya Huang, Yu Su, Shijin Wang

NeurIPS 2024 Computerized Adaptive Testing via Collaborative Ranking Zirui Liu, Yan Zhuang, Qi Liu, Jiatong Li, Yuren Zhang, Zhenya Huang, Jinze Wu, Shijin Wang

NeurIPS 2024 JiuZhang3.0: Efficiently Improving Mathematical Reasoning by Training Small Data Synthesis Models Kun Zhou, Beichen Zhang, Jiapeng Wang, Zhipeng Chen, Wayne Xin Zhao, Jing Sha, Zhichao Sheng, Shijin Wang, Ji-Rong Wen

IJCAI 2024 Learning to Solve Geometry Problems via Simulating Human Dual-Reasoning Process Tong Xiao, Jiayu Liu, Zhenya Huang, Jinze Wu, Jing Sha, Shijin Wang, Enhong Chen

NeurIPS 2024 SocraticLM: Exploring Socratic Personalized Teaching with Large Language Models Jiayu Liu, Zhenya Huang, Tong Xiao, Jing Sha, Jinze Wu, Qi Liu, Shijin Wang, Enhong Chen

NeurIPS 2024 Towards Accurate and Fair Cognitive Diagnosis via Monotonic Data Augmentation Zheng Zhang, Wei Song, Qi Liu, Qingyang Mao, Yiyan Wang, Weibo Gao, Zhenya Huang, Shijin Wang, Enhong Chen

AAAI 2023 BETA-CD: A Bayesian Meta-Learned Cognitive Diagnosis Framework for Personalized Learning Haoyang Bi, Enhong Chen, Weidong He, Han Wu, Weihao Zhao, Shijin Wang, Jinze Wu

NeurIPS 2023 Evaluating and Improving Tool-Augmented Computation-Intensive Math Reasoning Beichen Zhang, Kun Zhou, Xilin Wei, Xin Zhao, Jing Sha, Shijin Wang, Ji-Rong Wen

IJCAI 2023 Exploiting Non-Interactive Exercises in Cognitive Diagnosis Fangzhou Yao, Qi Liu, Min Hou, Shiwei Tong, Zhenya Huang, Enhong Chen, Jing Sha, Shijin Wang

AAAI 2023 Towards a Holistic Understanding of Mathematical Questions with Contrastive Pre-Training Yuting Ning, Zhenya Huang, Xin Lin, Enhong Chen, Shiwei Tong, Zheng Gong, Shijin Wang

AAAI 2021 HMS: A Hierarchical Solver with Dependency-Enhanced Understanding for Math Word Problem Xin Lin, Zhenya Huang, Hongke Zhao, Enhong Chen, Qi Liu, Hao Wang, Shijin Wang

AAAI 2020 Discriminative Sentence Modeling for Story Ending Prediction Yiming Cui, Wanxiang Che, Wei-Nan Zhang, Ting Liu, Shijin Wang, Guoping Hu

AAAI 2020 Neural Cognitive Diagnosis for Intelligent Education Systems Fei Wang, Qi Liu, Enhong Chen, Zhenya Huang, Yuying Chen, Yu Yin, Zai Huang, Shijin Wang

AAAI 2019 Convolutional Spatial Attention Model for Reading Comprehension with Multiple-Choice Questions Zhipeng Chen, Yiming Cui, Wentao Ma, Shijin Wang, Guoping Hu