Yang, Zhilin

19 publications

ICLR 2025 Learning to Plan Before Answering: Self-Teaching LLMs to Learn Abstract Plans for Problem Solving Jin Zhang, Flood Sung, Zhilin Yang, Yang Gao, Chongjie Zhang

NeurIPS 2025 MoBA: Mixture of Block Attention for Long-Context LLMs Enzhe Lu, Zhejun Jiang, Jingyuan Liu, Yulun Du, Tao Jiang, Chao Hong, Shaowei Liu, Weiran He, Enming Yuan, Yuzhi Wang, Zhiqi Huang, Huan Yuan, Suting Xu, Xinran Xu, Guokun Lai, Yanru Chen, Huabin Zheng, Junjie Yan, Jianlin Su, Yuxin Wu, Yutao Zhang, Zhilin Yang, Xinyu Zhou, Mingxing Zhang, Jiezhong Qiu

NeurIPS 2025 OpenCUA: Open Foundations for Computer-Use Agents Xinyuan Wang, Bowen Wang, Dunjie Lu, Junlin Yang, Tianbao Xie, Junli Wang, Jiaqi Deng, Xiaole Guo, Yiheng Xu, Chen Henry Wu, Zhennan Shen, Zhuokai Li, Ryan Li, Xiaochuan Li, Junda Chen, Zheng Boyuan, Li Peihang, Fangyu Lei, Ruisheng Cao, Yeqiao Fu, Dongchan Shin, Martin Shin, Hu Jiarui, Yuyan Wang, Jixuan Chen, Yuxiao Ye, Danyang Zhang, Yipu Wang, Heng Wang, Diyi Yang, Victor Zhong, Y.Charles, Zhilin Yang, Tao Yu

ICLR 2023 Compositional Task Representations for Large Language Models Nan Shao, Zefan Cai, Hanwei Xu, Chonghua Liao, Yanan Zheng, Zhilin Yang

ICLR 2023 Not All Tasks Are Born Equal: Understanding Zero-Shot Generalization Jing Zhou, Zongyu Lin, Yanan Zheng, Jian Li, Zhilin Yang

ICML 2022 NLP from Scratch Without Large-Scale Pretraining: A Simple and Efficient Framework Xingcheng Yao, Yanan Zheng, Xiaocong Yang, Zhilin Yang

AAAI 2021 Distribution Matching for Rationalization Yongfeng Huang, Yujun Chen, Yulun Du, Zhilin Yang

NeurIPS 2019 Mixtape: Breaking the SoftMax Bottleneck Efficiently Zhilin Yang, Thang Luong, Ruslan Salakhutdinov, Quoc V Le

NeurIPS 2019 XLNet: Generalized Autoregressive Pretraining for Language Understanding Zhilin Yang, Zihang Dai, Yiming Yang, Jaime Carbonell, Ruslan Salakhutdinov, Quoc V Le

ICLR 2018 Breaking the SoftMax Bottleneck: A High-Rank RNN Language Model Zhilin Yang, Zihang Dai, Ruslan Salakhutdinov, William W. Cohen

NeurIPS 2018 GLoMo: Unsupervised Learning of Transferable Relational Graphs Zhilin Yang, Jake Zhao, Bhuwan Dhingra, Kaiming He, William W. Cohen, Ruslan Salakhutdinov, Yann LeCun

ICLR 2018 Mastering the Dungeon: Grounded Language Learning by Mechanical Turker Descent Zhilin Yang, Saizheng Zhang, Jack Urbanek, Will Feng, Alexander Miller, Arthur Szlam, Douwe Kiela, Jason Weston

NeurIPS 2017 Differentiable Learning of Logical Rules for Knowledge Base Reasoning Fan Yang, Zhilin Yang, William W. Cohen

NeurIPS 2017 Good Semi-Supervised Learning That Requires a Bad GAN Zihang Dai, Zhilin Yang, Fan Yang, William W. Cohen, Ruslan Salakhutdinov

ICLR 2017 Transfer Learning for Sequence Tagging with Hierarchical Recurrent Networks Zhilin Yang, Ruslan Salakhutdinov, William W. Cohen

ICLR 2017 Words or Characters? Fine-Grained Gating for Reading Comprehension Zhilin Yang, Bhuwan Dhingra, Ye Yuan, Junjie Hu, William W. Cohen, Ruslan Salakhutdinov

IJCAI 2016 Multi-Modal Bayesian Embeddings for Learning Social Knowledge Graphs Zhilin Yang, Jie Tang, William W. Cohen

NeurIPS 2016 Review Networks for Caption Generation Zhilin Yang, Ye Yuan, Yuexin Wu, William W. Cohen, Ruslan Salakhutdinov

ICML 2016 Revisiting Semi-Supervised Learning with Graph Embeddings Zhilin Yang, William Cohen, Ruslan Salakhudinov