Yang, John

15 publications

ICML 2025 EnIGMA: Interactive Tools Substantially Assist LM Agents in Finding Security Vulnerabilities Talor Abramovich, Meet Udeshi, Minghao Shao, Kilian Lieret, Haoran Xi, Kimberly Milner, Sofija Jancheska, John Yang, Carlos E Jimenez, Farshad Khorrami, Prashanth Krishnamurthy, Brendan Dolan-Gavitt, Muhammad Shafique, Karthik R Narasimhan, Ramesh Karri, Ofir Press

ICLR 2025 MMTEB: Massive Multilingual Text Embedding Benchmark Kenneth Enevoldsen, Isaac Chung, Imene Kerboua, Márton Kardos, Ashwin Mathur, David Stap, Jay Gala, Wissam Siblini, Dominik Krzemiński, Genta Indra Winata, Saba Sturua, Saiteja Utpala, Mathieu Ciancone, Marion Schaeffer, Diganta Misra, Shreeya Dhakal, Jonathan Rystrøm, Roman Solomatin, Ömer Veysel Çağatan, Akash Kundu, Martin Bernstorff, Shitao Xiao, Akshita Sukhlecha, Bhavish Pahwa, Rafał Poświata, Kranthi Kiran Gv, Shawon Ashraf, Daniel Auras, Björn Plüster, Jan Philipp Harries, Loïc Magne, Isabelle Mohr, Dawei Zhu, Hippolyte Gisserot-Boukhlef, Tom Aarsen, Jan Kostkan, Konrad Wojtasik, Taemin Lee, Marek Suppa, Crystina Zhang, Roberta Rocca, Mohammed Hamdy, Andrianos Michail, John Yang, Manuel Faysse, Aleksei Vatolin, Nandan Thakur, Manan Dey, Dipam Vasani, Pranjal A Chitale, Simone Tedeschi, Nguyen Tai, Artem Snegirev, Mariya Hendriksen, Michael Günther, Mengzhou Xia, Weijia Shi, Xing Han Lù, Jordan Clive, Gayatri K, Maksimova Anna, Silvan Wehrli, Maria Tikhonova, Henil Shalin Panchal, Aleksandr Abramov, Malte Ostendorff, Zheng Liu, Simon Clematide, Lester James Validad Miranda, Alena Fenogenova, Guangyu Song, Ruqiya Bin Safi, Wen-Ding Li, Alessia Borghini, Federico Cassano, Lasse Hansen, Sara Hooker, Chenghao Xiao, Vaibhav Adlakha, Orion Weller, Siva Reddy, Niklas Muennighoff

ICLR 2025 SWE-Bench Multimodal: Do AI Systems Generalize to Visual Software Domains? John Yang, Carlos E Jimenez, Alex L Zhang, Kilian Lieret, Joyce Yang, Xindi Wu, Ori Press, Niklas Muennighoff, Gabriel Synnaeve, Karthik R Narasimhan, Diyi Yang, Sida Wang, Ofir Press

NeurIPS 2025 SWE-Smith: Scaling Data for Software Engineering Agents John Yang, Kilian Lieret, Carlos E Jimenez, Alexander Wettig, Kabir Khandpur, Yanzhe Zhang, Binyuan Hui, Ofir Press, Ludwig Schmidt, Diyi Yang

NeurIPS 2024 SWE-Agent: Agent-Computer Interfaces Enable Automated Software Engineering John Yang, Carlos E. Jimenez, Alexander Wettig, Kilian Lieret, Shunyu Yao, Karthik Narasimhan, Ofir Press

ICLR 2024 SWE-Bench: Can Language Models Resolve Real-World GitHub Issues? Carlos E Jimenez, John Yang, Alexander Wettig, Shunyu Yao, Kexin Pei, Ofir Press, Karthik R Narasimhan

NeurIPS 2023 InterCode: Standardizing and Benchmarking Interactive Coding with Execution Feedback John Yang, Akshara Prabhakar, Karthik Narasimhan, Shunyu Yao

NeurIPSW 2023 Language Agents as Hackers: Evaluating Cybersecurity Skills with Capture the Flag John Yang, Akshara Prabhakar, Shunyu Yao, Kexin Pei, Karthik R Narasimhan

WACV 2022 Dynamic Iterative Refinement for Efficient 3D Hand Pose Estimation John Yang, Yash Bhalgat, Simyung Chang, Fatih Porikli, Nojun Kwak

NeurIPSW 2022 Towards an Enhanced, Faithful, and Adaptable Web Interaction Environment John Yang, Howard Chen, Karthik R Narasimhan

NeurIPS 2022 WebShop: Towards Scalable Real-World Web Interaction with Grounded Language Agents Shunyu Yao, Howard Chen, John Yang, Karthik Narasimhan

ECCV 2020 SeqHAND: RGB-Sequence-Based 3D Hand Pose and Shape Estimation John Yang, Hyung Jin Chang, Seungeui Lee, Nojun Kwak

ACML 2019 Towards Governing Agent’s Efficacy: Action-Conditional $β$-VAE for Deep Transparent Reinforcement Learning John Yang, Gyuejeong Lee, Simyung Chang, Nojun Kwak

ECCV 2018 Broadcasting Convolutional Network for Visual Relational Reasoning Simyung Chang, John Yang, SeongUk Park, Nojun Kwak

NeurIPS 2018 Genetic-Gated Networks for Deep Reinforcement Learning Simyung Chang, John Yang, Jaeseok Choi, Nojun Kwak