Yang, Xianjun

16 publications

ICCV 2025 Beyond Training: Dynamic Token Merging for Zero-Shot Video Understanding Yiming Zhang, Zhuokai Zhao, Zhaorun Chen, Zenghui Ding, Xianjun Yang, Yining Sun

ICML 2025 MELON: Provable Defense Against Indirect Prompt Injection Attacks in AI Agents Kaijie Zhu, Xianjun Yang, Jindong Wang, Wenbo Guo, William Yang Wang

AAAI 2025 Unveiling the Impact of Coding Data Instruction Fine-Tuning on Large Language Models Reasoning Xinlu Zhang, Zhiyu Zoey Chen, Xi Ye, Xianjun Yang, Lichang Chen, William Yang Wang, Linda Ruth Petzold

ICML 2025 Weak-to-Strong Jailbreaking on Large Language Models Xuandong Zhao, Xianjun Yang, Tianyu Pang, Chao Du, Lei Li, Yu-Xiang Wang, William Yang Wang

TMLR 2024 A Survey on Large Language Models for Critical Societal Domains: Finance, Healthcare, and Law Zhiyu Chen, Jing Ma, Xinlu Zhang, Nan Hao, An Yan, Armineh Nourbakhsh, Xianjun Yang, Julian McAuley, Linda Ruth Petzold, William Yang Wang

NeurIPS 2024 DALD: Improving Logits-Based Detector Without Logits from Black-Box LLMs Cong Zeng, Shengkun Tang, Xianjun Yang, Yuanzhou Chen, Yiyou Sun, Zhiqiang Xu, Yao Li, Haifeng Chen, Wei Cheng, Dongkuan Xu

ICLR 2024 DNA-GPT: Divergent N-Gram Analysis for Training-Free Detection of GPT-Generated Text Xianjun Yang, Wei Cheng, Yue Wu, Linda Ruth Petzold, William Yang Wang, Haifeng Chen

ICLR 2024 Enhancing Small Medical Learners with Privacy-Preserving Contextual Prompting Xinlu Zhang, Shiyang Li, Xianjun Yang, Chenxin Tian, Yao Qin, Linda Ruth Petzold

ICML 2024 Position: A Safe Harbor for AI Evaluation and Red Teaming Shayne Longpre, Sayash Kapoor, Kevin Klyman, Ashwin Ramaswami, Rishi Bommasani, Borhane Blili-Hamelin, Yangsibo Huang, Aviya Skowron, Zheng Xin Yong, Suhas Kotha, Yi Zeng, Weiyan Shi, Xianjun Yang, Reid Southen, Alexander Robey, Patrick Chao, Diyi Yang, Ruoxi Jia, Daniel Kang, Alex Pentland, Arvind Narayanan, Percy Liang, Peter Henderson

ICLRW 2024 Shadow Alignment: The Ease of Subverting Safely-Aligned Language Models Xianjun Yang, Xiao Wang, Qi Zhang, Linda Ruth Petzold, William Yang Wang, Xun Zhao, Dahua Lin

ICMLW 2024 TrustAgent: Towards Safe and Trustworthy LLM-Based Agents Through Agent Constitution Wenyue Hua, Xianjun Yang, Mingyu Jin, Zelong Li, Wei Cheng, Ruixiang Tang, Yongfeng Zhang

ICMLW 2024 Weak-to-Strong Jailbreaking on Large Language Models Xuandong Zhao, Xianjun Yang, Tianyu Pang, Chao Du, Lei Li, Yu-Xiang Wang, William Yang Wang

NeurIPSW 2023 Enhancing Small Medical Learners with Privacy-Preserving Contextual Prompting Xinlu Zhang, Shiyang Li, Xianjun Yang, Chenxin Tian, Yao Qin, Linda Ruth Petzold

NeurIPS 2023 LLMScore: Unveiling the Power of Large Language Models in Text-to-Image Synthesis Evaluation Yujie Lu, Xianjun Yang, Xiujun Li, Xin Eric Wang, William Yang Wang

ICLRW 2023 MatKB: Semantic Search for Polycrystalline Materials Synthesis Procedures Xianjun Yang, Stephen Wilson, Linda Petzold

ICML 2023 ReDi: Efficient Learning-Free Diffusion Inference via Trajectory Retrieval Kexun Zhang, Xianjun Yang, William Yang Wang, Lei Li