Xie, Cihang

64 publications

TMLR 2025 AQA-Bench: An Interactive Benchmark for Evaluating LLMs’ Sequential Reasoning Ability in Algorithmic Environments Siwei Yang, Bingchen Zhao, Cihang Xie

TMLR 2025 ARVideo: Autoregressive Pretraining for Self-Supervised Video Representation Learning Sucheng Ren, Hongru Zhu, Chen Wei, Yijiang Li, Alan Yuille, Cihang Xie

CVPR 2025 Adventurer: Optimizing Vision Mamba Architecture Designs for Efficiency Feng Wang, Timing Yang, Yaodong Yu, Sucheng Ren, Guoyizhe Wei, Angtian Wang, Wei Shao, Yuyin Zhou, Alan Yuille, Cihang Xie

TMLR 2025 AttnGCG: Enhancing Jailbreaking Attacks on LLMs with Attention Manipulation Zijun Wang, Haoqin Tu, Jieru Mei, Bingchen Zhao, Yisen Wang, Cihang Xie

ICLR 2025 Autoregressive Pretraining with Mamba in Vision Sucheng Ren, Xianhang Li, Haoqin Tu, Feng Wang, Fangxun Shu, Lei Zhang, Jieru Mei, Linjie Yang, Peng Wang, Heng Wang, Alan Yuille, Cihang Xie

CVPRW 2025 Efficient VideoMAE via Temporal Progressive Training Xianhang Li, Peng Wang, Xinyu Li, Heng Wang, Hongru Zhu, Cihang Xie

CVPR 2025 Generative Image Layer Decomposition with Visual Effects Jinrui Yang, Qing Liu, Yijun Li, Soo Ye Kim, Daniil Pakhomov, Mengwei Ren, Jianming Zhang, Zhe Lin, Cihang Xie, Yuyin Zhou

ICLR 2025 HQ-Edit: A High-Quality Dataset for Instruction-Based Image Editing Mude Hui, Siwei Yang, Bingchen Zhao, Yichun Shi, Heng Wang, Peng Wang, Cihang Xie, Yuyin Zhou

CVPR 2025 Mamba-Reg: Vision Mamba Also Needs Registers Feng Wang, Jiahao Wang, Sucheng Ren, Guoyizhe Wei, Jieru Mei, Wei Shao, Yuyin Zhou, Alan Yuille, Cihang Xie

ICLR 2025 MedTrinity-25m: A Large-Scale Multimodal Dataset with Multigranular Annotations for Medicine Yunfei Xie, Ce Zhou, Lang Gao, Juncheng Wu, Xianhang Li, Hong-Yu Zhou, Sheng Liu, Lei Xing, James Zou, Cihang Xie, Yuyin Zhou

ICCV 2025 OpenVision: A Fully-Open, Cost-Effective Family of Advanced Vision Encoders for Multimodal Learning Xianhang Li, Yanqing Liu, Haoqin Tu, Cihang Xie

CVPRW 2025 Probing Vulnerabilities of Vision-LiDAR Based Autonomous Driving Systems Siwei Yang, Zeyu Wang, Diego Ortiz Barbosa, Luis Burbano, Murat Kantarcioglu, Alvaro A. Cárdenas, Cihang Xie

TMLR 2025 Reliable and Responsible Foundation Models Xinyu Yang, Junlin Han, Rishi Bommasani, Jinqi Luo, Wenjie Qu, Wangchunshu Zhou, Adel Bibi, Xiyao Wang, Jaehong Yoon, Elias Stengel-Eskin, Shengbang Tong, Lingfeng Shen, Rafael Rafailov, Runjia Li, Zhaoyang Wang, Yiyang Zhou, Chenhang Cui, Yu Wang, Wenhao Zheng, Huichi Zhou, Jindong Gu, Zhaorun Chen, Peng Xia, Tony Lee, Thomas P Zollo, Vikash Sehwag, Jixuan Leng, Jiuhai Chen, Yuxin Wen, Huan Zhang, Zhun Deng, Linjun Zhang, Pavel Izmailov, Pang Wei Koh, Yulia Tsvetkov, Andrew Gordon Wilson, Jiaheng Zhang, James Zou, Cihang Xie, Hao Wang, Philip Torr, Julian McAuley, David Alvarez-Melis, Florian Tramèr, Kaidi Xu, Suman Jana, Chris Callison-Burch, Rene Vidal, Filippos Kokkinos, Mohit Bansal, Beidi Chen, Huaxiu Yao

TMLR 2025 SFT or RL? an Early Investigation into Training R1-like Reasoning Large Vision-Language Models Hardy Chen, Haoqin Tu, Fali Wang, Hui Liu, Xianfeng Tang, Xinya Du, Yuyin Zhou, Cihang Xie

TMLR 2025 SPFormer: Enhancing Vision Transformer with Superpixel Representation Jieru Mei, Liang-Chieh Chen, Alan Yuille, Cihang Xie

ICML 2025 Scaling Laws in Patchification: An Image Is Worth 50,176 Tokens and More Feng Wang, Yaodong Yu, Wei Shao, Yuyin Zhou, Alan Yuille, Cihang Xie

ICCV 2025 VideoLLaMB: Long Streaming Video Understanding with Recurrent Memory Bridges Yuxuan Wang, Yiqi Song, Cihang Xie, Yang Liu, Zilong Zheng

ICML 2025 What if We Recaption Billions of Web Images with Llama-3? Xianhang Li, Haoqin Tu, Mude Hui, Zeyu Wang, Bingchen Zhao, Junfei Xiao, Sucheng Ren, Jieru Mei, Qing Liu, Huangjie Zheng, Yuyin Zhou, Cihang Xie

ECCV 2024 A Semantic Space Is Worth 256 Language Descriptions: Make Stronger Segmentation Models with Descriptive Properties Junfei Xiao, Ziqi Zhou, Wenxuan Li, Shiyi Lan, Jieru Mei, Zhiding Yu, Bingchen Zhao, Alan Yuille, Yuyin Zhou, Cihang Xie

CVPRW 2024 Benchmarking Robustness in Neural Radiance Fields Chen Wang, Angtian Wang, Junbo Li, Alan L. Yuille, Cihang Xie

TMLR 2024 FedConv: Enhancing Convolutional Neural Networks for Handling Data Heterogeneity in Federated Learning Peiran Xu, Zeyu Wang, Jieru Mei, Liangqiong Qu, Alan Yuille, Cihang Xie, Yuyin Zhou

ECCV 2024 From Pixels to Objects: A Hierarchical Approach for Part and Object Segmentation Using Local and Global Aggregation Yunfei Xie, Cihang Xie, Alan Yuille, Jieru Mei

ECCV 2024 How Many Unicorns Are in This Image? a Safety Evaluation Benchmark for Vision LLMs Haoqin Tu, Chenhang Cui, Zijun Wang, Yiyang Zhou, Bingchen Zhao, Junlin Han, Wangchunshu Zhou, Huaxiu Yao, Cihang Xie

CVPR 2024 L2B: Learning to Bootstrap Robust Models for Combating Label Noise Yuyin Zhou, Xianhang Li, Fengze Liu, Qingyue Wei, Xuxi Chen, Lequan Yu, Cihang Xie, Matthew P. Lungren, Lei Xing

CVPRW 2024 Masked Autoencoders Are Secretly Efficient Learners Zihao Wei, Chen Wei, Jieru Mei, Yutong Bai, Zeyu Wang, Xianhang Li, Hongru Zhu, Huiyu Wang, Alan L. Yuille, Yuyin Zhou, Cihang Xie

TMLR 2024 On the Adversarial Robustness of Camera-Based 3D Object Detection Shaoyuan Xie, Zichao Li, Zeyu Wang, Cihang Xie

ICML 2024 Rejuvenating Image-GPT as Strong Visual Representation Learners Sucheng Ren, Zeyu Wang, Hongru Zhu, Junfei Xiao, Alan Yuille, Cihang Xie

CVPR 2024 Revisiting Adversarial Training at Scale Zeyu Wang, Xianhang Li, Hongru Zhu, Cihang Xie

TMLR 2024 Scaling (Down) CLIP: A Comprehensive Analysis of Data,Architecture, and Training Strategies Zichao Li, Cihang Xie, Ekin Dogus Cubuk

NeurIPS 2024 Scaling White-Box Transformers for Vision Jinrui Yang, Xianhang Li, Druv Pai, Yuyin Zhou, Yi Ma, Yaodong Yu, Cihang Xie

CVPR 2024 Sculpting Holistic 3D Representation in Contrastive Language-Image-3D Pre-Training Yipeng Gao, Zeyu Wang, Wei-Shi Zheng, Cihang Xie, Yuyin Zhou

TMLR 2024 Sight Beyond Text: Multi-Modal Training Enhances LLMs in Truthfulness and Ethics Haoqin Tu, Bingchen Zhao, Chen Wei, Cihang Xie

ICLR 2024 Tuning LayerNorm in Attention: Towards Efficient Multi-Modal LLM Finetuning Bingchen Zhao, Haoqin Tu, Chen Wei, Jieru Mei, Cihang Xie

TMLR 2024 Unleashing the Power of Visual Prompting at the Pixel Level Junyang Wu, Xianhang Li, Chen Wei, Huiyu Wang, Alan Yuille, Yuyin Zhou, Cihang Xie

NeurIPS 2024 VHELM: A Holistic Evaluation of Vision Language Models Tony Lee, Haoqin Tu, Chi Heem Wong, Wenhao Zheng, Yiyang Zhou, Yifan Mai, Josselin Somerville Roberts, Michihiro Yasunaga, Huaxiu Yao, Cihang Xie, Percy Liang

NeurIPS 2023 An Inverse Scaling Law for CLIP Training Xianhang Li, Zeyu Wang, Cihang Xie

NeurIPSW 2023 CLIPA-V2: Scaling CLIP Training with 81.1% Zero-Shot ImageNet Accuracy Within a $10,000 Budget Xianhang Li, Zeyu Wang, Cihang Xie

ICLR 2023 Can CNNs Be More Robust than Transformers? Zeyu Wang, Yutong Bai, Yuyin Zhou, Cihang Xie

ICCV 2023 Diffusion Models as Masked Autoencoders Chen Wei, Karttikeya Mangalam, Po-Yao Huang, Yanghao Li, Haoqi Fan, Hu Xu, Huiyu Wang, Cihang Xie, Alan Yuille, Christoph Feichtenhofer

ICCV 2023 DistillBEV: Boosting Multi-Camera 3D Object Detection with Cross-Modal Knowledge Distillation Zeyu Wang, Dingwen Li, Chenxu Luo, Cihang Xie, Xiaodong Yang

CVPR 2023 Masked Autoencoders Enable Efficient Knowledge Distillers Yutong Bai, Zeyu Wang, Junfei Xiao, Chen Wei, Huiyu Wang, Alan L. Yuille, Yuyin Zhou, Cihang Xie

ICLR 2023 One-Pixel Shortcut: On the Learning Preference of Deep Neural Networks Shutong Wu, Sizhe Chen, Cihang Xie, Xiaolin Huang

AAAI 2023 Practical Disruption of Image Translation Deepfake Networks Nataniel Ruiz, Sarah Adel Bargal, Cihang Xie, Stan Sclaroff

ICCV 2023 SMAUG: Sparse Masked Autoencoder for Efficient Video-Language Pre-Training Yuanze Lin, Chen Wei, Huiyu Wang, Alan Yuille, Cihang Xie

NeurIPSW 2023 Sight Beyond Text: Multi-Modal Training Enhances LLMs in Truthfulness and Ethics Haoqin Tu, Bingchen Zhao, Chen Wei, Cihang Xie

CVPR 2022 A Simple Data Mixing Prior for Improving Self-Supervised Learning Sucheng Ren, Huiyu Wang, Zhengqi Gao, Shengfeng He, Alan Yuille, Yuyin Zhou, Cihang Xie

NeurIPS 2022 Adversarial Attack on Attackers: Post-Process to Mitigate Black-Box Score-Based Query Attacks Sizhe Chen, Zhehao Huang, Qinghua Tao, Yingwen Wu, Cihang Xie, Xiaolin Huang

ICLR 2022 Fast AdvProp Jieru Mei, Yucheng Han, Yutong Bai, Yixiao Zhang, Yingwei Li, Xianhang Li, Alan Yuille, Cihang Xie

NeurIPS 2022 Finding Differences Between Transformers and ConvNets Using Counterfactual Simulation Testing Nataniel Ruiz, Sarah Bargal, Cihang Xie, Kate Saenko, Stan Sclaroff

ICLR 2022 Image BERT Pre-Training with Online Tokenizer Jinghao Zhou, Chen Wei, Huiyu Wang, Wei Shen, Cihang Xie, Alan Yuille, Tao Kong

ECCV 2022 In Defense of Image Pre-Training for Spatiotemporal Recognition Xianhang Li, Huiyu Wang, Chen Wei, Jieru Mei, Alan Yuille, Yuyin Zhou, Cihang Xie

NeurIPSW 2022 Mitigating Lies in Vision-Language Models Junbo Li, Xianhang Li, Cihang Xie

CVPR 2022 Simulated Adversarial Testing of Face Recognition Models Nataniel Ruiz, Adam Kortylewski, Weichao Qiu, Cihang Xie, Sarah Adel Bargal, Alan Yuille, Stan Sclaroff

ECCV 2022 VIP: Unified Certified Detection and Recovery for Patch Attack with Vision Transformers Junbo Li, Huan Zhang, Cihang Xie

NeurIPS 2021 Are Transformers More Robust than CNNs? Yutong Bai, Jieru Mei, Alan L. Yuille, Cihang Xie

ICCV 2021 Calibrating Concepts and Operations: Towards Symbolic Reasoning on Real Images Zhuowan Li, Elias Stengel-Eskin, Yixiao Zhang, Cihang Xie, Quan Hung Tran, Benjamin Van Durme, Alan Yuille

CVPR 2021 Robust and Accurate Object Detection via Adversarial Learning Xiangning Chen, Cihang Xie, Mingxing Tan, Li Zhang, Cho-Jui Hsieh, Boqing Gong

ICLR 2021 Shape-Texture Debiased Neural Network Training Yingwei Li, Qihang Yu, Mingxing Tan, Jieru Mei, Peng Tang, Wei Shen, Alan Yuille, Cihang Xie

ICLR 2020 Intriguing Properties of Adversarial Training at Scale Cihang Xie, Alan Yuille

AAAI 2020 Learning Transferable Adversarial Examples via Ghost Networks Yingwei Li, Song Bai, Yuyin Zhou, Cihang Xie, Zhishuai Zhang, Alan L. Yuille

ECCV 2020 PatchAttack: A Black-Box Texture-Based Attack with Reinforcement Learning Chenglin Yang, Adam Kortylewski, Cihang Xie, Yinzhi Cao, Alan Yuille

ECCV 2020 Regional Homogeneity: Towards Learning Transferable Universal Adversarial Perturbations Against Defenses Yingwei Li, Song Bai, Cihang Xie, Zhenyu Liao, Xiaohui Shen, Alan Yuille

ICLR 2018 Mitigating Adversarial Effects Through Randomization Cihang Xie, Jianyu Wang, Zhishuai Zhang, Zhou Ren, Alan Yuille

ICCV 2017 Adversarial Examples for Semantic Segmentation and Object Detection Cihang Xie, Jianyu Wang, Zhishuai Zhang, Yuyin Zhou, Lingxi Xie, Alan Yuille