Tsvetkov, Yulia

34 publications

ICLRW 2025 A False Sense of Privacy: Evaluating Textual Data Sanitization Beyond Surface-Level Privacy Leakage Rui Xin, Niloofar Mireshghallah, Shuyue Stella Li, Michael Duan, Hyunwoo Kim, Yejin Choi, Yulia Tsvetkov, Sewoong Oh, Pang Wei Koh

NeurIPS 2025 Artificial Hivemind: The Open-Ended Homogeneity of Language Models (and Beyond) Liwei Jiang, Yuanjun Chai, Margaret Li, Mickel Liu, Raymond Fok, Nouha Dziri, Yulia Tsvetkov, Maarten Sap, Yejin Choi

NeurIPS 2025 Escaping the SpuriVerse: Can Large Vision-Language Models Generalize Beyond Seen Spurious Correlations? Yiwei Yang, Chung Peng Lee, Shangbin Feng, Dora Zhao, Bingbing Wen, Anthony Zhe Liu, Yulia Tsvetkov, Bill Howe

ICLR 2025 Explore Theory of Mind: Program-Guided Adversarial Data Generation for Theory of Mind Reasoning Melanie Sclar, Jane Dwivedi-Yu, Maryam Fazel-Zarandi, Yulia Tsvetkov, Yonatan Bisk, Yejin Choi, Asli Celikyilmaz

NeurIPS 2025 Heterogeneous Swarms: Jointly Optimizing Model Roles and Weights for Multi-LLM Systems Shangbin Feng, Zifeng Wang, Palash Goyal, Yike Wang, Weijia Shi, Huang Xia, Hamid Palangi, Luke Zettlemoyer, Yulia Tsvetkov, Chen-Yu Lee, Tomas Pfister

ICML 2025 Model Swarms: Collaborative Search to Adapt LLM Experts via Swarm Intelligence Shangbin Feng, Zifeng Wang, Yike Wang, Sayna Ebrahimi, Hamid Palangi, Lesly Miculicich, Achin Kulshrestha, Nathalie Rauschmayr, Yejin Choi, Yulia Tsvetkov, Chen-Yu Lee, Tomas Pfister

ICML 2025 Position: Political Neutrality in AI Is Impossible — But Here Is How to Approximate It Jillian Fisher, Ruth Elisabeth Appel, Chan Young Park, Yujin Potter, Liwei Jiang, Taylor Sorensen, Shangbin Feng, Yulia Tsvetkov, Margaret Roberts, Jennifer Pan, Dawn Song, Yejin Choi

NeurIPS 2025 Precise Information Control in Long-Form Text Generation Jacqueline He, Howard Yen, Margaret Li, Shuyue Stella Li, Zhiyuan Zeng, Weijia Shi, Yulia Tsvetkov, Danqi Chen, Pang Wei Koh, Luke Zettlemoyer

TMLR 2025 Reliable and Responsible Foundation Models Xinyu Yang, Junlin Han, Rishi Bommasani, Jinqi Luo, Wenjie Qu, Wangchunshu Zhou, Adel Bibi, Xiyao Wang, Jaehong Yoon, Elias Stengel-Eskin, Shengbang Tong, Lingfeng Shen, Rafael Rafailov, Runjia Li, Zhaoyang Wang, Yiyang Zhou, Chenhang Cui, Yu Wang, Wenhao Zheng, Huichi Zhou, Jindong Gu, Zhaorun Chen, Peng Xia, Tony Lee, Thomas P Zollo, Vikash Sehwag, Jixuan Leng, Jiuhai Chen, Yuxin Wen, Huan Zhang, Zhun Deng, Linjun Zhang, Pavel Izmailov, Pang Wei Koh, Yulia Tsvetkov, Andrew Gordon Wilson, Jiaheng Zhang, James Zou, Cihang Xie, Hao Wang, Philip Torr, Julian McAuley, David Alvarez-Melis, Florian Tramèr, Kaidi Xu, Suman Jana, Chris Callison-Burch, Rene Vidal, Filippos Kokkinos, Mohit Bansal, Beidi Chen, Huaxiu Yao

NeurIPS 2025 Sparta Alignment: Collectively Aligning Multiple Language Models Through Combat Yuru Jiang, Wenxuan Ding, Shangbin Feng, Greg Durrett, Yulia Tsvetkov

ICLR 2025 Varying Shades of Wrong: Aligning LLMs with Wrong Answers Only Jihan Yao, Wenxuan Ding, Shangbin Feng, Lucy Lu Wang, Yulia Tsvetkov

NeurIPSW 2024 A False Sense of Privacy: Evaluating Textual Data Sanitization Beyond Surface-Level Privacy Leakage Rui Xin, Niloofar Mireshghallah, Shuyue Stella Li, Hyunwoo Kim, Michael Duan, Yejin Choi, Yulia Tsvetkov, Sewoong Oh, Pang Wei Koh

NeurIPSW 2024 A False Sense of Privacy: Evaluating Textual Data Sanitization Beyond Surface-Level Privacy Leakage Rui Xin, Niloofar Mireshghallah, Shuyue Stella Li, Michael Duan, Hyunwoo Kim, Yejin Choi, Yulia Tsvetkov, Sewoong Oh, Pang Wei Koh

NeurIPSW 2024 Alpaca Against Vicuna: Using LLMs to Uncover Memorization of LLMs Aly M. Kassem, Omar Mahmoud, Niloofar Mireshghallah, Hyunwoo Kim, Yulia Tsvetkov, Yejin Choi, Sherif Saad, Santu Rana

ICLR 2024 Can LLMs Keep a Secret? Testing Privacy Implications of Language Models via Contextual Integrity Theory Niloofar Mireshghallah, Hyunwoo Kim, Xuhui Zhou, Yulia Tsvetkov, Maarten Sap, Reza Shokri, Yejin Choi

ICLR 2024 Gen-Z: Generative Zero-Shot Text Classification with Contextualized Label Descriptions Sachin Kumar, Chan Young Park, Yulia Tsvetkov

ICLR 2024 Knowledge Card: Filling LLMs' Knowledge Gaps with Plug-in Specialized Language Models Shangbin Feng, Weijia Shi, Yuyang Bai, Vidhisha Balachandran, Tianxing He, Yulia Tsvetkov

ICMLW 2024 Learning Syntax Without Planting Trees: Understanding When and Why Transformers Generalize Hierarchically Kabir Ahuja, Vidhisha Balachandran, Madhur Panwar, Tianxing He, Noah A. Smith, Navin Goyal, Yulia Tsvetkov

NeurIPS 2024 MAGNET: Improving the Multilingual Fairness of Language Models with Adaptive Gradient-Based Tokenization Orevaoghene Ahia, Sachin Kumar, Hila Gonen, Valentin Hofmann, Tomasz Limisiewicz, Yulia Tsvetkov, Noah A. Smith

NeurIPS 2024 MatFormer: Nested Transformer for Elastic Inference Devvrit, Sneha Kudugunta, Aditya Kusupati, Tim Dettmers, Kaifeng Chen, Inderjit Dhillon, Yulia Tsvetkov, Hannaneh Hajishirzi, Sham Kakade, Ali Farhadi, Prateek Jain

NeurIPS 2024 MediQ: Question-Asking LLMs and a Benchmark for Reliable Interactive Clinical Reasoning Shuyue Stella Li, Vidhisha Balachandran, Shangbin Feng, Jonathan S. Ilgen, Emma Pierson, Pang Wei Koh, Yulia Tsvetkov

ICLR 2024 Quantifying Language Models' Sensitivity to Spurious Features in Prompt Design or: How I Learned to Start Worrying About Prompt Formatting Melanie Sclar, Yejin Choi, Yulia Tsvetkov, Alane Suhr

NeurIPS 2024 The Art of Saying No: Contextual Noncompliance in Language Models Faeze Brahman, Sachin Kumar, Vidhisha Balachandran, Pradeep Dasigi, Valentina Pyatkin, Abhilasha Ravichander, Sarah Wiegreffe, Nouha Dziri, Khyathi Chandu, Jack Hessel, Yulia Tsvetkov, Noah A. Smith, Yejin Choi, Hannaneh Hajishirzi

NeurIPS 2023 Can Language Models Solve Graph Problems in Natural Language? Heng Wang, Shangbin Feng, Tianxing He, Zhaoxuan Tan, Xiaochuang Han, Yulia Tsvetkov

NeurIPSW 2023 MatFormer: Nested Transformer for Elastic Inference Fnu Devvrit, Sneha Kudugunta, Aditya Kusupati, Tim Dettmers, Kaifeng Chen, Inderjit S Dhillon, Yulia Tsvetkov, Hannaneh Hajishirzi, Sham M. Kakade, Ali Farhadi, Prateek Jain

ICMLW 2023 Minding Language Models' (Lack of) Theory of Mind: A Plug-and-Play Multi-Character Belief Tracker Melanie Sclar, Sachin Kumar, Peter West, Alane Suhr, Yejin Choi, Yulia Tsvetkov

ICLR 2022 SimVLM: Simple Visual Language Model Pretraining with Weak Supervision Zirui Wang, Jiahui Yu, Adams Wei Yu, Zihang Dai, Yulia Tsvetkov, Yuan Cao

NeurIPS 2021 Controlled Text Generation as Continuous Optimization with Multiple Constraints Sachin Kumar, Eric Malmi, Aliaksei Severyn, Yulia Tsvetkov

ICLR 2021 DialoGraph: Incorporating Interpretable Strategy-Graph Networks into Negotiation Dialogues Rishabh Joshi, Vidhisha Balachandran, Shikhar Vashishth, Alan Black, Yulia Tsvetkov

ICLR 2021 Gradient Vaccine: Investigating and Improving Multi-Task Optimization in Massively Multilingual Models Zirui Wang, Yulia Tsvetkov, Orhan Firat, Yuan Cao

ICLR 2020 Augmenting Non-Collaborative Dialog Systems with Explicit Semantic and Strategic Dialog History Yiheng Zhou, Yulia Tsvetkov, Alan W Black, Zhou Yu

NeurIPSW 2020 End-to-End Differentiable GANs for Text Generation Sachin Kumar, Yulia Tsvetkov

ICLR 2019 Von Mises-Fisher Loss for Training Sequence to Sequence Models with Continuous Outputs Sachin Kumar, Yulia Tsvetkov

JAIR 2016 Cross-Lingual Bridges with Models of Lexical Borrowing Yulia Tsvetkov, Chris Dyer