Wang, Xin Eric

33 publications

ICLR 2025 Agent S: An Open Agentic Framework That Uses Computers like a Human Saaket Agashe, Jiuzhou Han, Shuyu Gan, Jiachen Yang, Ang Li, Xin Eric Wang

ICLRW 2025 Agent S: An Open Agentic Framework That Uses Computers like a Human Saaket Agashe, Jiuzhou Han, Shuyu Gan, Jiachen Yang, Ang Li, Xin Eric Wang

ICLR 2025 EditRoom: LLM-Parameterized Graph Diffusion for Composable 3D Room Layout Editing Kaizhi Zheng, Xiaotong Chen, Xuehai He, Jing Gu, Linjie Li, Zhengyuan Yang, Kevin Lin, Jianfeng Wang, Lijuan Wang, Xin Eric Wang

NeurIPS 2025 GRIT: Teaching MLLMs to Think with Images Yue Fan, Xuehai He, Diji Yang, Kaizhi Zheng, Ching-Chen Kuo, Yuting Zheng, Xinze Guan, Xin Eric Wang

ICLR 2025 MMWorld: Towards Multi-Discipline Multi-Faceted World Model Evaluation in Videos Xuehai He, Weixi Feng, Kaizhi Zheng, Yujie Lu, Wanrong Zhu, Jiachen Li, Yue Fan, Jianfeng Wang, Linjie Li, Zhengyuan Yang, Kevin Lin, William Yang Wang, Lijuan Wang, Xin Eric Wang

NeurIPS 2025 More Thinking, Less Seeing? Assessing Amplified Hallucination in Multimodal Reasoning Models Zhongxing Xu, Chengzhi Liu, Qingyue Wei, Juncheng Wu, James Zou, Xin Eric Wang, Yuyin Zhou, Sheng Liu

ICLR 2025 Multimodal Situational Safety Kaiwen Zhou, Chengzhi Liu, Xuandong Zhao, Anderson Compalas, Dawn Song, Xin Eric Wang

NeurIPS 2025 Soft Thinking: Unlocking the Reasoning Potential of LLMs in Continuous Concept Space Zhen Zhang, Xuehai He, Weixiang Yan, Ao Shen, Chenyang Zhao, Xin Eric Wang

ICCV 2025 VLM4D: Towards Spatiotemporal Awareness in Vision Language Models Shijie Zhou, Alexander Vilesov, Xuehai He, Ziyu Wan, Shuwang Zhang, Aditya Nagachandra, Di Chang, Dongdong Chen, Xin Eric Wang, Achuta Kadambi

NeurIPSW 2024 Agent S: An Open Agentic Framework That Uses Computers like a Human Saaket Agashe, Jiuzhou Han, Shuyu Gan, Jiachen Yang, Ang Li, Xin Eric Wang

TMLR 2024 Discffusion: Discriminative Diffusion Models as Few-Shot Vision and Language Learners Xuehai He, Weixi Feng, Tsu-Jui Fu, Varun Jampani, Arjun Reddy Akula, Pradyumna Narayana, S Basu, William Yang Wang, Xin Eric Wang

TMLR 2024 FlexEControl: Flexible and Efficient Multimodal Control for Text-to-Image Generation Xuehai He, Jian Zheng, Jacob Zhiyuan Fang, Robinson Piramuthu, Mohit Bansal, Vicente Ordonez, Gunnar A Sigurdsson, Nanyun Peng, Xin Eric Wang

NeurIPSW 2024 MMWorld: Towards Multi-Discipline Multi-Faceted World Model Evaluation in Videos Xuehai He, Weixi Feng, Kaizhi Zheng, Yujie Lu, Wanrong Zhu, Jiachen Li, Yue Fan, Jianfeng Wang, Linjie Li, Zhengyuan Yang, Kevin Lin, William Yang Wang, Lijuan Wang, Xin Eric Wang

NeurIPSW 2024 Multimodal Situational Safety Kaiwen Zhou, Chengzhi Liu, Xuandong Zhao, Anderson Compalas, Xin Eric Wang

ECCV 2024 NavGPT-2: Unleashing Navigational Reasoning Capability for Large Vision-Language Models Gengze Zhou, Yicong Hong, Zun Wang, Xin Eric Wang, Qi Wu

ECCV 2024 SwapAnything: Enabling Arbitrary Object Swapping in Personalized Image Editing Jing Gu, Nanxuan Zhao, Wei Xiong, Qing Liu, Zhifei Zhang, He Zhang, Jianming Zhang, HyunJoon Jung, Yilin Wang, Xin Eric Wang

NeurIPSW 2024 VIA: A Spatiotemporal Video Adaptation Framework for Global and Local Video Editing Jing Gu, Yuwei Fang, Ivan Skorokhodov, Peter Wonka, Xinya Du, Sergey Tulyakov, Xin Eric Wang

NeurIPSW 2024 Worse than Random? an Embarrassingly Simple Probing Evaluation of Large Multimodal Models in Medical VQA Qianqi Yan, Xuehai He, Xiang Yue, Xin Eric Wang

WACV 2023 CUDA-GHR: Controllable Unsupervised Domain Adaptation for Gaze and Head Redirection Swati Jindal, Xin Eric Wang

ICML 2023 ESC: Exploration with Soft Commonsense Constraints for Zero-Shot Object Navigation Kaiwen Zhou, Kaizhi Zheng, Connor Pryor, Yilin Shen, Hongxia Jin, Lise Getoor, Xin Eric Wang

NeurIPS 2023 LLMScore: Unveiling the Power of Large Language Models in Text-to-Image Synthesis Evaluation Yujie Lu, Xianjun Yang, Xiujun Li, Xin Eric Wang, William Yang Wang

NeurIPS 2023 LayoutGPT: Compositional Visual Planning and Generation with Large Language Models Weixi Feng, Wanrong Zhu, Tsu-Jui Fu, Varun Jampani, Arjun Akula, Xuehai He, S Basu, Xin Eric Wang, William Yang Wang

ICLR 2023 Neuro-Symbolic Procedural Planning with Commonsense Prompting Yujie Lu, Weixi Feng, Wanrong Zhu, Wenda Xu, Xin Eric Wang, Miguel Eckstein, William Yang Wang

NeurIPS 2023 PHOTOSWAP: Personalized Subject Swapping in Images Jing Gu, Yilin Wang, Nanxuan Zhao, Tsu-Jui Fu, Wei Xiong, Qing Liu, Zhifei Zhang, He Zhang, Jianming Zhang, HyunJoon Jung, Xin Eric Wang

AAAI 2023 Parameter-Efficient Model Adaptation for Vision Transformers Xuehai He, Chunyuan Li, Pengchuan Zhang, Jianwei Yang, Xin Eric Wang

ICLR 2023 Training-Free Structured Diffusion Guidance for Compositional Text-to-Image Synthesis Weixi Feng, Xuehai He, Tsu-Jui Fu, Varun Jampani, Arjun Reddy Akula, Pradyumna Narayana, Sugato Basu, Xin Eric Wang, William Yang Wang

CVPR 2022 Compositional Temporal Grounding with Structured Variational Cross-Graph Correspondence Learning Juncheng Li, Junlin Xie, Long Qian, Linchao Zhu, Siliang Tang, Fei Wu, Yi Yang, Yueting Zhuang, Xin Eric Wang

ECCV 2022 FedVLN: Privacy-Preserving Federated Vision-and-Language Navigation Kaiwen Zhou, Xin Eric Wang

ECCV 2022 Language-Driven Artistic Style Transfer Tsu-Jui Fu, Xin Eric Wang, William Yang Wang

CVPR 2022 M3L: Language-Based Video Editing via Multi-Modal Multi-Level Transformers Tsu-Jui Fu, Xin Eric Wang, Scott T. Grafton, Miguel P. Eckstein, William Yang Wang

ICML 2022 Understanding Instance-Level Impact of Fairness Constraints Jialu Wang, Xin Eric Wang, Yang Liu

ECCV 2020 Counterfactual Vision-and-Language Navigation via Adversarial Path Sampler Tsu-Jui Fu, Xin Eric Wang, Matthew F. Peterson, Scott T. Grafton, Miguel P. Eckstein, William Yang Wang

ECCV 2020 Environment-Agnostic Multitask Learning for Natural Language Grounded Navigation Xin Eric Wang, Vihan Jain, Eugene Ie, William Yang Wang, Zornitsa Kozareva, Sujith Ravi[2]