Staab, Robin

21 publications

ICLR 2025 Black-Box Detection of Language Model Watermarks Thibaud Gloaguen, Nikola Jovanović, Robin Staab, Martin Vechev

ICML 2025 Discovering Spoofing Attempts on Language Model Watermarks Thibaud Gloaguen, Nikola Jovanović, Robin Staab, Martin Vechev

ICLRW 2025 Discovering Spoofing Attempts on Language Model Watermarks Thibaud Gloaguen, Nikola Jovanović, Robin Staab, Martin Vechev

ICLR 2025 Language Models Are Advanced Anonymizers Robin Staab, Mark Vero, Mislav Balunovic, Martin Vechev

ICML 2025 Mind the Gap: A Practical Attack on GGUF Quantization Kazuki Egashira, Robin Staab, Mark Vero, Jingxuan He, Martin Vechev

ICLRW 2025 Mind the Gap: A Practical Attack on GGUF Quantization Kazuki Egashira, Robin Staab, Mark Vero, Jingxuan He, Martin Vechev

NeurIPS 2025 MixAT: Combining Continuous and Discrete Adversarial Training for LLMs Csaba Dékány, Stefan Balauca, Dimitar Iliev Dimitrov, Robin Staab, Martin Vechev

ICLRW 2025 Towards Watermarking of Open-Source LLMs Thibaud Gloaguen, Nikola Jovanović, Robin Staab, Martin Vechev

ICLR 2025 Ward: Provable RAG Dataset Inference via LLM Watermarks Nikola Jovanović, Robin Staab, Maximilian Baader, Martin Vechev

NeurIPS 2024 A Synthetic Dataset for Personal Attribute Inference Hanna Yukhymenko, Robin Staab, Mark Vero, Martin Vechev

ICLR 2024 Beyond Memorization: Violating Privacy via Inference with Large Language Models Robin Staab, Mark Vero, Mislav Balunovic, Martin Vechev

ICMLW 2024 Black-Box Detection of Language Model Watermarks Thibaud Gloaguen, Nikola Jovanović, Robin Staab, Martin Vechev

ICMLW 2024 Black-Box Detection of Language Model Watermarks Thibaud Gloaguen, Nikola Jovanović, Robin Staab, Martin Vechev

NeurIPS 2024 Exploiting LLM Quantization Kazuki Egashira, Mark Vero, Robin Staab, Jingxuan He, Martin Vechev

ICMLW 2024 Exploiting LLM Quantization Kazuki Egashira, Mark Vero, Robin Staab, Jingxuan He, Martin Vechev

ICLRW 2024 Large Language Models Are Anonymizers Robin Staab, Mark Vero, Mislav Balunovic, Martin Vechev

NeurIPS 2024 Private Attribute Inference from Images with Vision-Language Models Batuhan Tömekçe, Mark Vero, Robin Staab, Martin Vechev

ICMLW 2024 Private Attribute Inference from Images with Vision-Language Models Batuhan Tömekçe, Mark Vero, Robin Staab, Martin Vechev

ICML 2024 Watermark Stealing in Large Language Models Nikola Jovanović, Robin Staab, Martin Vechev

ICLRW 2024 Watermark Stealing in Large Language Models Nikola Jovanović, Robin Staab, Martin Vechev

ICLR 2022 Bayesian Framework for Gradient Leakage Mislav Balunovic, Dimitar Iliev Dimitrov, Robin Staab, Martin Vechev