Liang, Xiaodan

180 publications

TMLR 2026 COLT: Enhancing Video Large Language Models with Continual Tool Usage Yuyang Liu, Meng Cao, Xinyuan Shi, Xiaodan Liang

TMLR 2026 Order from Chaos: Physical World Understanding from Glitchy Gameplay Videos Meng Cao, Haoran Tang, Haoze Zhao, Mingfei Han, Ruyang Liu, Qiang Sun, Xiaojun Chang, Ian Reid, Xiaodan Liang

ICCV 2025 A0: An Affordance-Aware Hierarchical Model for General Robotic Manipulation Rongtao Xu, Jian Zhang, Minghao Guo, Youpeng Wen, Haoting Yang, Min Lin, Jianzheng Huang, Zhe Li, Kaidong Zhang, Liqiong Wang, Yuxuan Kuang, Meng Cao, Feng Zheng, Xiaodan Liang

AAAI 2025 Affordances-Oriented Planning Using Foundation Models for Continuous Vision-Language Navigation Jiaqi Chen, Bingqian Lin, Xinmin Liu, Lin Ma, Xiaodan Liang, Kwan-Yee K. Wong

AAAI 2025 BEV-TSR: Text-Scene Retrieval in BEV Space for Autonomous Driving Tao Tang, Dafeng Wei, Zhengyu Jia, Tian Gao, Changwei Cai, Chengkai Hou, Peng Jia, Kun Zhan, Haiyang Sun, Jingchen Fan, Yixing Zhao, Xiaodan Liang, Xianpeng Lang, Yang Wang

ICLR 2025 CatVTON: Concatenation Is All You Need for Virtual Try-on with Diffusion Models Zheng Chong, Xiao Dong, Haoxiang Li, Shiyue Zhang, Wenqing Zhang, Hanqing Zhao, Xujie Zhang, Dongmei Jiang, Xiaodan Liang

WACV 2025 DisCo: Discovering Common Affordance from Large Models for Actionable Part Perception Youpeng Wen, Yi Zhu, Zhihao Zhan, Pengzhen Ren, Jianhua Han, Hang Xu, Shen Zhao, Xiaodan Liang

AAAI 2025 DreamFit: Garment-Centric Human Generation via a Lightweight Anything-Dressing Encoder Ente Lin, Xujie Zhang, Fuwei Zhao, Yuxuan Luo, Xin Dong, Long Zeng, Xiaodan Liang

CVPR 2025 EMOVA: Empowering Language Models to See, Hear and Speak with Vivid Emotions Kai Chen, Yunhao Gou, Runhui Huang, Zhili Liu, Daxin Tan, Jing Xu, Chunwei Wang, Yi Zhu, Yihan Zeng, Kuo Yang, Dingdong Wang, Kun Xiang, Haoyuan Li, Haoli Bai, Jianhua Han, Xiaohui Li, Weike Jin, Nian Xie, Yu Zhang, James T. Kwok, Hengshuang Zhao, Xiaodan Liang, Dit-Yan Yeung, Xiao Chen, Zhenguo Li, Wei Zhang, Qun Liu, Lanqing Hong, Lu Hou, Hang Xu

CVPR 2025 FireEdit: Fine-Grained Instruction-Based Image Editing via Region-Aware Vision Language Model Jun Zhou, Jiahao Li, Zunnan Xu, Hanhui Li, Yiji Cheng, Fa-Ting Hong, Qin Lin, Qinglin Lu, Xiaodan Liang

ICLR 2025 GDrag:Towards General-Purpose Interactive Editing with Anti-Ambiguity Point Diffusion Xiaojian Lin, Hanhui Li, Yuhao Cheng, Yiqiang Yan, Xiaodan Liang

CVPR 2025 HiRes-LLaVA: Restoring Fragmentation Input in High-Resolution Large Vision-Language Models Runhui Huang, Xinpeng Ding, Chunwei Wang, Jianhua Han, Yulong Liu, Hengshuang Zhao, Hang Xu, Lu Hou, Wei Zhang, Xiaodan Liang

AAAI 2025 MUSE: Mamba Is Efficient Multi-Scale Learner for Text-Video Retrieval Haoran Tang, Meng Cao, Jinfa Huang, Ruyang Liu, Peng Jin, Ge Li, Xiaodan Liang

NeurIPS 2025 MineAnyBuild: Benchmarking Spatial Planning for Open-World AI Agents Ziming Wei, Bingqian Lin, Zijian Jiao, Yunshuang Nie, Liang Ma, Yuecheng Liu, Yuzheng Zhuang, Xiaodan Liang

ICLR 2025 OptiBench Meets ReSocratic: Measure and Improve LLMs for Optimization Modeling Zhicheng Yang, Yiwei Wang, Yinya Huang, Zhijiang Guo, Wei Shi, Xiongwei Han, Liang Feng, Linqi Song, Xiaodan Liang, Jing Tang

ICLR 2025 PT-T2I/V: An Efficient Proxy-Tokenized Diffusion Transformer for Text-to-Image/Video-Task Jing Wang, Ao Ma, Jiasong Feng, Dawei Leng, Yuhui Yin, Xiaodan Liang

NeurIPS 2025 PhyBlock: A Progressive Benchmark for Physical Understanding and Planning via 3D Block Assembly Liang Ma, Jiajun Wen, Min Lin, Rongtao Xu, Xiwen Liang, Bingqian Lin, Jun Ma, Yongxin Wang, Ziming Wei, Haokun Lin, Mingfei Han, Meng Cao, Bokui Chen, Ivan Laptev, Xiaodan Liang

WACV 2025 Realistic and Efficient Face Swapping: A Unified Approach with Diffusion Models Sanoojan Baliah, Qinliang Lin, Shengcai Liao, Xiaodan Liang, Muhammad Haris Khan

ICCV 2025 RoBridge: A Hierarchical Architecture Bridging Cognition and Execution for General Robotic Manipulation Kaidong Zhang, Rongtao Xu, Pengzhen Ren, Junfan Lin, Hefeng Wu, Liang Lin, Xiaodan Liang

ICCV 2025 RoboPearls: Editable Video Simulation for Robot Manipulation Tang Tao, Likui Zhang, Youpeng Wen, Kaidong Zhang, Jia-Wang Bian, Xia Zhou, Tianyi Yan, Kun Zhan, Peng Jia, Hefeng Wu, Liang Lin, Xiaodan Liang

ICCV 2025 RoboTron-Drive: All-in-One Large Multimodal Model for Autonomous Driving Zhijian Huang, Chengjian Feng, Feng Yan, Baihui Xiao, Zequn Jie, Yujie Zhong, Xiaodan Liang, Lin Ma

CVPR 2025 RoomTour3D: Geometry-Aware Video-Instruction Tuning for Embodied Navigation Mingfei Han, Liang Ma, Kamila Zhumakhanova, Ekaterina Radionova, Jingyi Zhang, Xiaojun Chang, Xiaodan Liang, Ivan Laptev

ICML 2025 S2-Track: A Simple yet Strong Approach for End-to-End 3D Multi-Object Tracking Tao Tang, Lijun Zhou, Pengkun Hao, Zihang He, Kalok Ho, Shuo Gu, Zhihui Hao, Haiyang Sun, Kun Zhan, Peng Jia, Xianpeng Lang, Xiaodan Liang

NeurIPS 2025 SPC: Evolving Self-Play Critic via Adversarial Games for LLM Reasoning Jiaqi Chen, Bang Zhang, Ruotian Ma, Peisong Wang, Xiaodan Liang, Zhaopeng Tu, Xiaolong Li, Kwan-Yee K. Wong

NeurIPS 2025 SeePhys: Does Seeing Help Thinking? – Benchmarking Vision-Based Physics Reasoning Kun Xiang, Heng Li, Terry Jingchen Zhang, Yinya Huang, Zirong Liu, Peixin Qu, Jixi He, Jiaqi Chen, Yu-Jie Yuan, Jianhua Han, Hang Xu, Hanhui Li, Mrinmaya Sachan, Xiaodan Liang

ICLR 2025 Sitcom-Crafter: A Plot-Driven Human Motion Generation System in 3D Scenes Jianqi Chen, Panwen Hu, Xiaojun Chang, Zhenwei Shi, Michael Kampffmeyer, Xiaodan Liang

ICLR 2025 UniGS: Unified Language-Image-3D Pretraining with Gaussian Splatting Haoyuan Li, Zhou Yanpeng, Tao Tang, Jifei Song, Yihan Zeng, Michael Kampffmeyer, Hang Xu, Xiaodan Liang

NeurIPS 2025 WISA: World Simulator Assistant for Physics-Aware Text-to-Video Generation Jing Wang, Ao Ma, Ke Cao, Jun Zheng, Jiasong Feng, Zhanjie Zhang, Wanyuan Pang, Xiaodan Liang

AAAI 2024 3D Visibility-Aware Generalizable Neural Radiance Fields for Interacting Hands Xuan Huang, Hanhui Li, Zejun Yang, Zhisheng Wang, Xiaodan Liang

NeurIPSW 2024 Advancing Theorem Proving in LLMs Through Large-Scale Synthetic Data Huajian Xin, Daya Guo, Zhihong Shao, Z.Z. Ren, Qihao Zhu, Bo Liu, Chong Ruan, Wenda Li, Xiaodan Liang

CVPR 2024 AlignMiF: Geometry-Aligned Multimodal Implicit Field for LiDAR-Camera Joint Synthesis Tang Tao, Guangrun Wang, Yixing Lao, Peng Chen, Jie Liu, Liang Lin, Kaicheng Yu, Xiaodan Liang

ICLR 2024 DQ-LoRe: Dual Queries with Low Rank Approximation Re-Ranking for In-Context Learning Jing Xiong, Zixuan Li, Chuanyang Zheng, Zhijiang Guo, Yichun Yin, Enze Xie, Zhicheng Yang, Qingxing Cao, Haiming Wang, Xiongwei Han, Jing Tang, Chengming Li, Xiaodan Liang

CVPR 2024 DetCLIPv3: Towards Versatile Generative Open-Vocabulary Object Detection Lewei Yao, Renjie Pi, Jianhua Han, Xiaodan Liang, Hang Xu, Wei Zhang, Zhenguo Li, Dan Xu

NeurIPS 2024 FVEL: Interactive Formal Verification Environment with Large Language Models via Theorem Proving Xiaohan Lin, Qingxing Cao, Yinya Huang, Haiming Wang, Jianqiao Lu, Zhengying Liu, Linqi Song, Xiaodan Liang

ECCV 2024 GarmentAligner: Text-to-Garment Generation via Retrieval-Augmented Multi-Level Corrections Shiyue Zhang, Zheng Chong, Xujie Zhang, Hanhui Li, Yuhao Cheng, Yiqiang Yan, Xiaodan Liang

CVPR 2024 Holistic Autonomous Driving Understanding by Bird's-Eye-View Injected Multi-Modal Large Models Xinpeng Ding, Jianhua Han, Hang Xu, Xiaodan Liang, Wei Zhang, Xiaomeng Li

ECCV 2024 HumanRefiner: Benchmarking Abnormal Human Generation and Refining with Coarse-to-Fine Pose-Reversible Guidance Guian Fang, Wenbiao Yan, Yuanfan Guo, Jianhua Han, Zutao Jiang, Hang Xu, Shengcai Liao, Xiaodan Liang

ICLR 2024 Ins-DetCLIP: Aligning Detection Model to Follow Human-Language Instruction Renjie Pi, Lewei Yao, Jianhua Han, Xiaodan Liang, Wei Zhang, Hang Xu

ICLR 2024 LEGO-Prover: Neural Theorem Proving with Growing Libraries Haiming Wang, Huajian Xin, Chuanyang Zheng, Zhengying Liu, Qingxing Cao, Yinya Huang, Jing Xiong, Han Shi, Enze Xie, Jian Yin, Zhenguo Li, Xiaodan Liang

ECCV 2024 LayerDiff: Exploring Text-Guided Multi-Layered Composable Image Synthesis via Layer-Collaborative Diffusion Model Runhui Huang, Kaixin Cai, Jianhua Han, Xiaodan Liang, Renjing Pei, Guansong Lu, Songcen Xu, Wei Zhang, Hang Xu

NeurIPS 2024 Learning Interaction-Aware 3D Gaussian Splatting for One-Shot Hand Avatars Xuan Huang, Hanhui Li, Wanquan Liu, Xiaodan Liang, Yiqiang Yan, Yuhao Cheng, Chengqiang Gao

ECCV 2024 Learning with Counterfactual Explanations for Radiology Report Generation Mingjie Li, Haokun Lin, Liang Qiu, Xiaodan Liang, Ling Chen, Abdulmotaleb Elsaddik, Xiaojun Chang

CVPR 2024 MLP Can Be a Good Transformer Learner Sihao Lin, Pumeng Lyu, Dongrui Liu, Tao Tang, Xiaodan Liang, Andy Song, Xiaojun Chang

ICLR 2024 MUSTARD: Mastering Uniform Synthesis of Theorem and Proof Data Yinya Huang, Xiaohan Lin, Zhengying Liu, Qingxing Cao, Huajian Xin, Haiming Wang, Zhenguo Li, Linqi Song, Xiaodan Liang

ECCV 2024 Making Large Language Models Better Planners with Reasoning-Decision Alignment Zhijian Huang, Tao Tang, Shaoxiang Chen, Sihao Lin, Zequn Jie, Lin Ma, Guangrun Wang, Xiaodan Liang

AAAI 2024 Monocular 3D Hand Mesh Recovery via Dual Noise Estimation Hanhui Li, Xiaojian Lin, Xuan Huang, Zejun Yang, Zhisheng Wang, Xiaodan Liang

NeurIPS 2024 PIVOT-R: Primitive-Driven Waypoint-Aware World Model for Robotic Manipulation Kaidong Zhang, Pengzhen Ren, Bingqian Lin, Junfan Lin, Shikui Ma, Hang Xu, Xiaodan Liang

AAAI 2024 PTUS: Photo-Realistic Talking Upper-Body Synthesis via 3D-Aware Motion Decomposition Warping Luoyang Lin, Zutao Jiang, Xiaodan Liang, Liqian Ma, Michael C. Kampffmeyer, Xiaochun Cao

NeurIPS 2024 Proving Theorems Recursively Haiming Wang, Huajian Xin, Zhengying Liu, Wenda Li, Yinya Huang, Jianqiao Lu, Zhicheng Yang, Jing Tang, Jian Yin, Zhenguo Li, Xiaodan Liang

AAAI 2024 Towards Detailed Text-to-Motion Synthesis via Basic-to-Advanced Hierarchical Diffusion Model Zhenyu Xie, Yang Wu, Xuehao Gao, Zhongqian Sun, Wei Yang, Xiaodan Liang

NeurIPS 2024 VidMan: Exploiting Implicit Dynamics from Video Diffusion Model for Effective Robot Manipulation Youpeng Wen, Junfan Lin, Yi Zhu, Jianhua Han, Hang Xu, Shen Zhao, Xiaodan Liang

NeurIPS 2024 Web2Code: A Large-Scale Webpage-to-Code Dataset and Evaluation Framework for Multimodal LLMs Sukmin Yun, Haokun Lin, Rusiru Thushara, Mohammad Qazim Bhat, Yongxin Wang, Zutao Jiang, Mingkai Deng, Jinhong Wang, Tianhua Tao, Junbo Li, Haonan Li, Preslav Nakov, Timothy Baldwin, Zhengzhong Liu, Eric P. Xing, Xiaodan Liang, Zhiqiang Shen

AAAI 2023 3D-TOGO: Towards Text-Guided Cross-Category 3D Object Generation Zutao Jiang, Guansong Lu, Xiaodan Liang, Jihua Zhu, Wei Zhang, Xiaojun Chang, Hang Xu

AAAI 2023 Actional Atomic-Concept Learning for Demystifying Vision-Language Navigation Bingqian Lin, Yi Zhu, Xiaodan Liang, Liang Lin, Jianzhuang Liu

CVPRW 2023 Benchmarking the Robustness of LiDAR-Camera Fusion for 3D Object Detection Kaicheng Yu, Tang Tao, Hongwei Xie, Zhiwei Lin, Tingting Liang, Bing Wang, Peng Chen, Dayang Hao, Yongtao Wang, Xiaodan Liang

CVPR 2023 CLIP2: Contrastive Language-Image-Point Pretraining from Real-World Point Cloud Data Yihan Zeng, Chenhan Jiang, Jiageng Mao, Jianhua Han, Chaoqiang Ye, Qingqiu Huang, Dit-Yan Yeung, Zhen Yang, Xiaodan Liang, Hang Xu

ICCV 2023 CTP:Towards Vision-Language Continual Pretraining via Compatible Momentum Contrast and Topology Preservation Hongguang Zhu, Yunchao Wei, Xiaodan Liang, Chunjie Zhang, Yao Zhao

CVPR 2023 CapDet: Unifying Dense Captioning and Open-World Detection Pretraining Yanxin Long, Youpeng Wen, Jianhua Han, Hang Xu, Pengzhen Ren, Wei Zhang, Shen Zhao, Xiaodan Liang

ICCV 2023 Coordinate Transformer: Achieving Single-Stage Multi-Person Mesh Recovery from Videos Haoyuan Li, Haoye Dong, Hanchao Jia, Dong Huang, Michael C. Kampffmeyer, Liang Lin, Xiaodan Liang

CVPR 2023 DetCLIPv2: Scalable Open-Vocabulary Object Detection Pre-Training via Word-Region Alignment Lewei Yao, Jianhua Han, Xiaodan Liang, Dan Xu, Wei Zhang, Zhenguo Li, Hang Xu

ICCV 2023 DiffCloth: Diffusion Based Garment Synthesis and Manipulation via Structural Cross-Modal Semantic Alignment Xujie Zhang, Binbin Yang, Michael C. Kampffmeyer, Wenqing Zhang, Shiyue Zhang, Guansong Lu, Liang Lin, Hang Xu, Xiaodan Liang

ICCV 2023 DiffDis: Empowering Generative Diffusion Model with Cross-Modal Discrimination Capability Runhui Huang, Jianhua Han, Guansong Lu, Xiaodan Liang, Yihan Zeng, Wei Zhang, Hang Xu

CVPR 2023 Dynamic Graph Enhanced Contrastive Learning for Chest X-Ray Report Generation Mingjie Li, Bingqian Lin, Zicong Chen, Haokun Lin, Xiaodan Liang, Xiaojun Chang

ICCV 2023 FULLER: Unified Multi-Modality Multi-Task 3D Perception via Multi-Level Gradient Calibration Zhijian Huang, Sihao Lin, Guiyu Liu, Mukun Luo, Chaoqiang Ye, Hang Xu, Xiaojun Chang, Xiaodan Liang

CVPR 2023 GP-VTON: Towards General Purpose Virtual Try-on via Collaborative Local-Flow Global-Parsing Learning Zhenyu Xie, Zaiyu Huang, Xin Dong, Fuwei Zhao, Haoye Dong, Xijin Zhang, Feida Zhu, Xiaodan Liang

ICCV 2023 GrowCLIP: Data-Aware Automatic Model Growing for Large-Scale Contrastive Language-Image Pre-Training Xinchi Deng, Han Shi, Runhui Huang, Changlin Li, Hang Xu, Jianhua Han, James Kwok, Shen Zhao, Wei Zhang, Xiaodan Liang

ICCV 2023 LAW-Diffusion: Complex Scene Generation by Diffusion with Layouts Binbin Yang, Yi Luo, Ziliang Chen, Guangrun Wang, Xiaodan Liang, Liang Lin

CVPR 2023 Learning to Segment Every Referring Object Point by Point Mengxue Qu, Yu Wu, Yunchao Wei, Wu Liu, Xiaodan Liang, Yao Zhao

MLOSS 2023 MARLlib: A Scalable and Efficient Multi-Agent Reinforcement Learning Library Siyi Hu, Yifan Zhong, Minquan Gao, Weixun Wang, Hao Dong, Xiaodan Liang, Zhihui Li, Xiaojun Chang, Yaodong Yang

ICCV 2023 MixReorg: Cross-Modal Mixed Patch Reorganization Is a Good Mask Learner for Open-World Semantic Segmentation Kaixin Cai, Pengzhen Ren, Yi Zhu, Hang Xu, Jianzhuang Liu, Changlin Li, Guangrun Wang, Xiaodan Liang

AAAI 2023 NLIP: Noise-Robust Language-Image Pre-Training Runhui Huang, Yanxin Long, Jianhua Han, Hang Xu, Xiwen Liang, Chunjing Xu, Xiaodan Liang

NeurIPS 2023 RIO: A Benchmark for Reasoning Intention-Oriented Objects in Open Environments Mengxue Qu, Yu Wu, Wu Liu, Xiaodan Liang, Jingkuan Song, Yao Zhao, Yunchao Wei

ICLR 2023 Self-Guided Noise-Free Data Generation for Efficient Zero-Shot Learning Jiahui Gao, Renjie Pi, Lin Yong, Hang Xu, Jiacheng Ye, Zhiyong Wu, Weizhong Zhang, Xiaodan Liang, Zhenguo Li, Lingpeng Kong

ICCV 2023 Towards High-Fidelity Text-Guided 3D Face Generation and Manipulation Using Only Images Cuican Yu, Guansong Lu, Yihan Zeng, Jian Sun, Xiaodan Liang, Huibin Li, Zongben Xu, Songcen Xu, Wei Zhang, Hang Xu

ICLR 2023 ViewCo: Discovering Text-Supervised Segmentation Masks via Multi-View Semantic Consistency Pengzhen Ren, Changlin Li, Hang Xu, Yi Zhu, Guangrun Wang, Jianzhuang Liu, Xiaojun Chang, Xiaodan Liang

IJCAI 2023 Vision Language Navigation with Knowledge-Driven Environmental Dreamer Fengda Zhu, Vincent CS Lee, Xiaojun Chang, Xiaodan Liang

CVPR 2023 Visual Exemplar Driven Task-Prompting for Unified Perception in Autonomous Driving Xiwen Liang, Minzhe Niu, Jianhua Han, Hang Xu, Chunjing Xu, Xiaodan Liang

IJCAI 2022 "My Nose Is Running." "Are You Also Coughing?": Building a Medical Diagnosis Agent with Interpretable Inquiry Logics Wenge Liu, Yi Cheng, Hao Wang, Jianheng Tang, Yafei Liu, Ruihui Zhao, Wenjie Li, Yefeng Zheng, Xiaodan Liang

CVPR 2022 ADAPT: Vision-Language Navigation with Modality-Aligned Action Prompts Bingqian Lin, Yi Zhu, Zicong Chen, Xiwen Liang, Jianzhuang Liu, Xiaodan Liang

CVPR 2022 Arch-Graph: Acyclic Architecture Relation Predictor for Task-Transferable Neural Architecture Search Minbin Huang, Zhijian Huang, Changlin Li, Xin Chen, Hang Xu, Zhenguo Li, Xiaodan Liang

AAAI 2022 AutoBERT-Zero: Evolving BERT Backbone from Scratch Jiahui Gao, Hang Xu, Han Shi, Xiaozhe Ren, Philip L. H. Yu, Xiaodan Liang, Xin Jiang, Zhenguo Li

CVPR 2022 Automated Progressive Learning for Efficient Training of Vision Transformers Changlin Li, Bohan Zhuang, Guangrun Wang, Xiaodan Liang, Xiaojun Chang, Yi Yang

CVPR 2022 Beyond Fixation: Dynamic Window Visual Transformer Pengzhen Ren, Changlin Li, Guangrun Wang, Yun Xiao, Qing Du, Xiaodan Liang, Xiaojun Chang

CVPR 2022 BodyGAN: General-Purpose Controllable Neural Human Body Generation Chaojie Yang, Hanhui Li, Shengjie Wu, Shengkai Zhang, Haonan Yan, Nianhong Jiao, Jie Tang, Runnan Zhou, Xiaodan Liang, Tianxiang Zheng

ECCV 2022 CODA: A Real-World Road Corner Case Dataset for Object Detection in Autonomous Driving Kaican Li, Kai Chen, Haoyu Wang, Lanqing Hong, Chaoqiang Ye, Jianhua Han, Yukuai Chen, Wei Zhang, Chunjing Xu, Dit-Yan Yeung, Xiaodan Liang, Zhenguo Li, Hang Xu

CVPR 2022 Continual Object Detection via Prototypical Task Correlation Guided Gating Mechanism Binbin Yang, Xinchi Deng, Han Shi, Changlin Li, Gengwei Zhang, Hang Xu, Shen Zhao, Liang Lin, Xiaodan Liang

AAAI 2022 Contrastive Instruction-Trajectory Learning for Vision-Language Navigation Xiwen Liang, Fengda Zhu, Yi Zhu, Bingqian Lin, Bing Wang, Xiaodan Liang

NeurIPS 2022 CoupAlign: Coupling Word-Pixel with Sentence-Mask Alignments for Referring Image Segmentation Zicheng Zhang, Yi Zhu, Jianzhuang Liu, Xiaodan Liang, Wei Ke

CVPR 2022 Cross-Modal Clinical Graph Transformer for Ophthalmic Report Generation Mingjie Li, Wenjia Cai, Karin Verspoor, Shirui Pan, Xiaodan Liang, Xiaojun Chang

NeurIPS 2022 DetCLIP: Dictionary-Enriched Visual-Concept Paralleled Pre-Training for Open-World Detection Lewei Yao, Jianhua Han, Youpeng Wen, Xiaodan Liang, Dan Xu, Wei Zhang, Zhenguo Li, Chunjing Xu, Hang Xu

CVPR 2022 Dressing in the Wild by Watching Dance Videos Xin Dong, Fuwei Zhao, Zhenyu Xie, Xijin Zhang, Daniel K. Du, Min Zheng, Xiang Long, Xiaodan Liang, Jianchao Yang

NeurIPS 2022 Effective Adaptation in Multi-Task Co-Training for Unified Autonomous Driving Xiwen Liang, Yangxin Wu, Jianhua Han, Hang Xu, Chunjing Xu, Xiaodan Liang

ICLR 2022 FILIP: Fine-Grained Interactive Language-Image Pre-Training Lewei Yao, Runhui Huang, Lu Hou, Guansong Lu, Minzhe Niu, Hang Xu, Xiaodan Liang, Zhenguo Li, Xin Jiang, Chunjing Xu

CVPR 2022 Knowledge Distillation via the Target-Aware Transformer Sihao Lin, Hongwei Xie, Bing Wang, Kaicheng Yu, Xiaojun Chang, Xiaodan Liang, Gang Wang

AAAI 2022 Laneformer: Object-Aware Row-Column Transformers for Lane Detection Jianhua Han, Xiajun Deng, Xinyue Cai, Zhen Yang, Hang Xu, Chunjing Xu, Xiaodan Liang

CVPR 2022 M5Product: Self-Harmonized Contrastive Learning for E-Commercial Multi-Modal Pretraining Xiao Dong, Xunlin Zhan, Yangxin Wu, Yunchao Wei, Michael C. Kampffmeyer, Xiaoyong Wei, Minlong Lu, Yaowei Wang, Xiaodan Liang

ECCV 2022 Open-World Semantic Segmentation via Contrasting and Clustering Vision-Language Embedding Quande Liu, Youpeng Wen, Jianhua Han, Chunjing Xu, Hang Xu, Xiaodan Liang

ICML 2022 Policy Diagnosis via Measuring Role Diversity in Cooperative Multi-Agent RL Siyi Hu, Chuanlong Xie, Xiaodan Liang, Xiaojun Chang

ICLR 2022 Revisiting Over-Smoothing in BERT from the Perspective of Graph Han Shi, Jiahui Gao, Hang Xu, Xiaodan Liang, Zhenguo Li, Lingpeng Kong, Stephen M. S. Lee, James Kwok

ECCV 2022 SiRi: A Simple Selective Retraining Mechanism for Transformer-Based Visual Grounding Mengxue Qu, Yu Wu, Wu Liu, Qiqi Gong, Xiaodan Liang, Olga Russakovsky, Yao Zhao, Yunchao Wei

NeurIPS 2022 Structure-Preserving 3D Garment Modeling with Neural Sewing Machines Xipeng Chen, Guangrun Wang, Dizhong Zhu, Xiaodan Liang, Philip Torr, Liang Lin

NeurIPS 2022 Towards Hard-Pose Virtual Try-on via 3D-Aware Global Correspondence Learning Zaiyu Huang, Hanhui Li, Zhenyu Xie, Michael Kampffmeyer, Qingling Cai, Xiaodan Liang

NeurIPS 2022 Wukong: A 100 Million Large-Scale Chinese Cross-Modal Pre-Training Benchmark Jiaxi Gu, Xiaojun Meng, Guansong Lu, Lu Hou, Niu Minzhe, Xiaodan Liang, Lewei Yao, Runhui Huang, Wei Zhang, Xin Jiang, Chunjing Xu, Hang Xu

AAAI 2021 Ada-Segment: Automated Multi-Loss Adaptation for Panoptic Segmentation Gengwei Zhang, Yiming Gao, Hang Xu, Hao Zhang, Zhenguo Li, Xiaodan Liang

AAAI 2021 Adversarial Meta Sampling for Multilingual Low-Resource Speech Recognition Yubei Xiao, Ke Gong, Pan Zhou, Guolin Zheng, Xiaodan Liang, Liang Lin

ICCV 2021 BossNAS: Exploring Hybrid CNN-Transformers with Block-Wisely Self-Supervised Neural Architecture Search Changlin Li, Tao Tang, Guangrun Wang, Jiefeng Peng, Bing Wang, Xiaodan Liang, Xiaojun Chang

CVPR 2021 Dynamic Slimmable Network Changlin Li, Guangrun Wang, Bing Wang, Xiaodan Liang, Zhihui Li, Xiaojun Chang

ICCV 2021 Exploring Geometry-Aware Contrast and Clustering Harmonization for Self-Supervised 3D Object Detection Hanxue Liang, Chenhan Jiang, Dapeng Feng, Xin Chen, Hang Xu, Xiaodan Liang, Wei Zhang, Zhenguo Li, Luc Van Gool

ICCV 2021 Exploring Inter-Channel Correlation for Diversity-Preserved Knowledge Distillation Li Liu, Qingle Huang, Sihao Lin, Hongwei Xie, Bing Wang, Xiaojun Chang, Xiaodan Liang

AAAI 2021 Graph-Evolving Meta-Learning for Low-Resource Medical Dialogue Generation Shuai Lin, Pan Zhou, Xiaodan Liang, Jianheng Tang, Ruihui Zhao, Ziliang Chen, Liang Lin

ICCV 2021 Linguistically Routing Capsule Network for Out-of-Distribution Visual Question Answering Qingxing Cao, Wentao Wan, Keze Wang, Xiaodan Liang, Liang Lin

ICLR 2021 Loss Function Discovery for Object Detection via Convergence-Simulation Driven Search Peidong Liu, Gengwei Zhang, Bochao Wang, Hang Xu, Xiaodan Liang, Yong Jiang, Zhenguo Li

ICCV 2021 M3D-VTON: A Monocular-to-3D Virtual Try-on Network Fuwei Zhao, Zhenyu Xie, Michael Kampffmeyer, Haoye Dong, Songfang Han, Tianxiang Zheng, Tao Zhang, Xiaodan Liang

ICCV 2021 NASOA: Towards Faster Task-Oriented Online Fine-Tuning with a Zoo of Models Hang Xu, Ning Kang, Gengwei Zhang, Chuanlong Xie, Xiaodan Liang, Zhenguo Li

ICCV 2021 Pi-NAS: Improving Neural Architecture Search by Reducing Supernet Training Consistency Shift Jiefeng Peng, Jiqi Zhang, Changlin Li, Guangrun Wang, Xiaodan Liang, Liang Lin

ICCV 2021 Product1M: Towards Weakly Supervised Instance-Level Product Retrieval via Cross-Modal Pretraining Xunlin Zhan, Yangxin Wu, Xiao Dong, Yunchao Wei, Minlong Lu, Yichi Zhang, Hang Xu, Xiaodan Liang

ICCV 2021 Pyramid R-CNN: Towards Better Performance and Adaptability for 3D Object Detection Jiageng Mao, Minzhe Niu, Haoyue Bai, Xiaodan Liang, Hang Xu, Chunjing Xu

AAAI 2021 REM-Net: Recursive Erasure Memory Network for Commonsense Evidence Refinement Yinya Huang, Meng Fang, Xunlin Zhan, Qingxing Cao, Xiaodan Liang

CVPR 2021 SOON: Scenario Oriented Object Navigation with Graph-Based Exploration Fengda Zhu, Xiwen Liang, Yi Zhu, Qizhi Yu, Xiaojun Chang, Xiaodan Liang

ICCV 2021 Self-Motivated Communication Agent for Real-World Vision-Dialog Navigation Yi Zhu, Yue Weng, Fengda Zhu, Xiaodan Liang, Qixiang Ye, Yutong Lu, Jianbin Jiao

ICML 2021 SparseBERT: Rethinking the Importance Analysis in Self-Attention Han Shi, Jiahui Gao, Xiaozhe Ren, Hang Xu, Xiaodan Liang, Zhenguo Li, James Tin-Yau Kwok

NeurIPS 2021 Towards Scalable Unpaired Virtual Try-on via Patch-Routed Spatially-Adaptive GAN Zhenyu Xie, Zaiyu Huang, Fuwei Zhao, Haoye Dong, Michael Kampffmeyer, Xiaodan Liang

CVPR 2021 TransNAS-Bench-101: Improving Transferability and Generalizability of Cross-Task Neural Architecture Search Yawen Duan, Xin Chen, Hang Xu, Zewei Chen, Xiaodan Liang, Tong Zhang, Zhenguo Li

ICLR 2021 UPDeT: Universal Multi-Agent RL via Policy Decoupling with Transformers Siyi Hu, Fengda Zhu, Xiaojun Chang, Xiaodan Liang

ICCV 2021 UltraPose: Synthesizing Dense Pose with 1 Billion Points by Human-Body Decoupling 3D Model Haonan Yan, Jiaqi Chen, Xujie Zhang, Shengkai Zhang, Nianhong Jiao, Xiaodan Liang, Tianxiang Zheng

ICCV 2021 Vision-Language Navigation with Random Environmental Mixup Chong Liu, Fengda Zhu, Xiaojun Chang, Xiaodan Liang, Zongyuan Ge, Yi-Dong Shen

ICCV 2021 Voxel Transformer for 3D Object Detection Jiageng Mao, Yujing Xue, Minzhe Niu, Haoyue Bai, Jiashi Feng, Xiaodan Liang, Hang Xu, Chunjing Xu

NeurIPS 2020 Auto-Panoptic: Cooperative Multi-Component Architecture Search for Panoptic Segmentation Yangxin Wu, Gengwei Zhang, Hang Xu, Xiaodan Liang, Liang Lin

NeurIPS 2020 AutoSync: Learning to Synchronize for Data-Parallel Distributed Deep Learning Hao Zhang, Yuan Li, Zhijie Deng, Xiaodan Liang, Lawrence Carin, Eric P. Xing

ECCV 2020 CATCH: Context-Based Meta Reinforcement Learning for Transferrable Architecture Search Xin Chen, Yawen Duan, Zewei Chen, Hang Xu, Zihao Chen, Xiaodan Liang, Tong Zhang, Zhenguo Li

ECCV 2020 CurveLane-NAS: Unifying Lane-Sensitive Architecture Search and Adaptive Point Blending Hang Xu, Shaoju Wang, Xinyue Cai, Wei Zhang, Xiaodan Liang, Zhenguo Li

AAAI 2020 Dynamic Knowledge Routing Network for Target-Guided Open-Domain Conversation Jinghui Qin, Zheng Ye, Jianheng Tang, Xiaodan Liang

AAAI 2020 ElixirNet: Relation-Aware Network Architecture Adaptation for Medical Lesion Detection Chenhan Jiang, Shaoju Wang, Xiaodan Liang, Hang Xu, Nong Xiao

AAAI 2020 SM-NAS: Structural-to-Modular Neural Architecture Search for Object Detection Lewei Yao, Hang Xu, Wei Zhang, Xiaodan Liang, Zhenguo Li

NeurIPS 2020 Towards Interpretable Natural Language Understanding with Explanations as Latent Variables Wangchunshu Zhou, Jinyi Hu, Hanlin Zhang, Xiaodan Liang, Maosong Sun, Chenyan Xiong, Jian Tang

AAAI 2020 Universal-RCNN: Universal Object Detector via Transferable Graph R-CNN Hang Xu, Linpu Fang, Xiaodan Liang, Wenxiong Kang, Zhenguo Li

ICLR 2019 AutoLoss: Learning Discrete Schedule for Alternate Optimization Haowen Xu, Hao Zhang, Zhiting Hu, Xiaodan Liang, Ruslan Salakhutdinov, Eric Xing

AAAI 2019 End-to-End Knowledge-Routed Relational Dialogue System for Automatic Diagnosis Lin Xu, Qixian Zhou, Ke Gong, Xiaodan Liang, Jianheng Tang, Liang Lin

NeurIPS 2019 Heterogeneous Graph Learning for Visual Commonsense Reasoning Weijiang Yu, Jingwen Zhou, Weihao Yu, Xiaodan Liang, Nong Xiao

AAAI 2019 Knowledge-Driven Encode, Retrieve, Paraphrase for Medical Image Report Generation Christy Y. Li, Xiaodan Liang, Zhiting Hu, Eric P. Xing

ICML 2019 Multivariate-Information Adversarial Ensemble for Scalable Joint Distribution Matching Ziliang Chen, Zhanfu Yang, Xiaoxi Wang, Xiaodan Liang, Xiaopeng Yan, Guanbin Li, Liang Lin

WACV 2019 Soft Transfer Learning via Gradient Diagnosis for Visual Relationship Detection Diqi Chen, Xiaodan Liang, Yizhou Wang, Wen Gao

ECCV 2018 A Modulation Module for Multi-Task Learning with Applications in Image Retrieval Xiangyun Zhao, Haoxiang Li, Xiaohui Shen, Xiaodan Liang, Ying Wu

ECCV 2018 Adversarial Geometry-Aware Human Motion Prediction Liang-Yan Gui, Yu-Xiong Wang, Xiaodan Liang, Jose M. F. Moura

ECCV 2018 CIRL: Controllable Imitative Reinforcement Learning for Vision-Based Self-Driving Xiaodan Liang, Tairui Wang, Luona Yang, Eric Xing

NeurIPS 2018 Deep Generative Models with Learnable Knowledge Constraints Zhiting Hu, Zichao Yang, Ruslan Salakhutdinov, Lianhui Qin, Xiaodan Liang, Haoye Dong, Eric P Xing

ECCV 2018 Generative Semantic Manipulation with Mask-Contrasting GAN Xiaodan Liang, Hao Zhang, Liang Lin, Eric Xing

NeurIPS 2018 Hybrid Knowledge Routed Modules for Large-Scale Object Detection ChenHan Jiang, Hang Xu, Xiaodan Liang, Liang Lin

NeurIPS 2018 Hybrid Retrieval-Generation Reinforced Agent for Medical Image Report Generation Yuan Li, Xiaodan Liang, Zhiting Hu, Eric P Xing

ECCV 2018 Instance-Level Human Parsing via Part Grouping Network Ke Gong, Xiaodan Liang, Yicheng Li, Yimin Chen, Ming Yang, Liang Lin

ECCV 2018 RCAA: Relational Context-Aware Agents for Person Search Xiaojun Chang, Po-Yao Huang, Yi-Dong Shen, Xiaodan Liang, Yi Yang, Alexander G. Hauptmann

ECCV 2018 Real-to-Virtual Domain Unification for End-to-End Autonomous Driving Luona Yang, Xiaodan Liang, Tairui Wang, Eric Xing

NeurIPS 2018 Soft-Gated Warping-GAN for Pose-Guided Person Image Synthesis Haoye Dong, Xiaodan Liang, Ke Gong, Hanjiang Lai, Jia Zhu, Jian Yin

NeurIPS 2018 Symbolic Graph Reasoning Meets Convolutions Xiaodan Liang, Zhiting Hu, Hao Zhang, Liang Lin, Eric P Xing

ECCV 2018 Toward Characteristic-Preserving Image-Based Virtual Try-on Network Bochao Wang, Huabin Zheng, Xiaodan Liang, Yimin Chen, Liang Lin, Meng Yang

CVPR 2017 Attention-Aware Face Hallucination via Deep Reinforcement Learning Qingxing Cao, Liang Lin, Yukai Shi, Xiaodan Liang, Guanbin Li

CVPR 2017 Deep Variation-Structured Reinforcement Learning for Visual Relationship and Attribute Detection Xiaodan Liang, Lisa Lee, Eric P. Xing

ICCV 2017 Dual Motion GAN for Future-Flow Embedded Video Prediction Xiaodan Liang, Lisa Lee, Wei Dai, Eric P. Xing

CVPR 2017 Interpretable Structure-Evolving LSTM Xiaodan Liang, Liang Lin, Xiaohui Shen, Jiashi Feng, Shuicheng Yan, Eric P. Xing

CVPR 2017 Look into Person: Self-Supervised Structure-Sensitive Learning and a New Benchmark for Human Parsing Ke Gong, Xiaodan Liang, Dongyu Zhang, Xiaohui Shen, Liang Lin

ICCV 2017 Nonparametric Variational Auto-Encoders for Hierarchical Representation Learning Prasoon Goyal, Zhiting Hu, Xiaodan Liang, Chenyu Wang, Eric P. Xing

CVPR 2017 Object Region Mining with Adversarial Erasing: A Simple Classification to Semantic Segmentation Approach Yunchao Wei, Jiashi Feng, Xiaodan Liang, Ming-Ming Cheng, Yao Zhao, Shuicheng Yan

CVPR 2017 Perceptual Generative Adversarial Networks for Small Object Detection Jianan Li, Xiaodan Liang, Yunchao Wei, Tingfa Xu, Jiashi Feng, Shuicheng Yan

CVPR 2017 Recurrent 3D Pose Sequence Machines Mude Lin, Liang Lin, Xiaodan Liang, Keze Wang, Hui Cheng

ICCV 2017 Recurrent Topic-Transition GAN for Visual Paragraph Generation Xiaodan Liang, Zhiting Hu, Hao Zhang, Chuang Gan, Eric P. Xing

NeurIPS 2017 Structured Generative Adversarial Networks Zhijie Deng, Hao Zhang, Xiaodan Liang, Luona Yang, Shizhen Xu, Jun Zhu, Eric P Xing

ICCV 2017 Temporal Dynamic Graph LSTM for Action-Driven Video Object Detection Yuan Yuan, Xiaodan Liang, Xiaolong Wang, Dit-Yan Yeung, Abhinav Gupta

ICML 2017 Toward Controlled Generation of Text Zhiting Hu, Zichao Yang, Xiaodan Liang, Ruslan Salakhutdinov, Eric P. Xing

CVPR 2016 Deep Structured Scene Parsing by Learning with Image Descriptions Liang Lin, Guangrun Wang, Rui Zhang, Ruimao Zhang, Xiaodan Liang, Wangmeng Zuo

IJCAI 2016 Geometric Scene Parsing with Hierarchical LSTM Zhanglin Peng, Ruimao Zhang, Xiaodan Liang, Xiaobai Liu, Liang Lin

ECCV 2016 Is Faster R-CNN Doing Well for Pedestrian Detection? Liliang Zhang, Liang Lin, Xiaodan Liang, Kaiming He

ECCV 2016 LSTM-CF: Unifying Context Modeling and Fusion with LSTMs for RGB-D Scene Labeling Zhen Li, Yukang Gan, Xiaodan Liang, Yizhou Yu, Hui Cheng, Liang Lin

ECCV 2016 Peak-Piloted Deep Network for Facial Expression Recognition Xiangyun Zhao, Xiaodan Liang, Luoqi Liu, Teng Li, Yugang Han, Nuno Vasconcelos, Shuicheng Yan

CVPR 2016 Reversible Recursive Instance-Level Object Segmentation Xiaodan Liang, Yunchao Wei, Xiaohui Shen, Zequn Jie, Jiashi Feng, Liang Lin, Shuicheng Yan

ECCV 2016 Semantic Object Parsing with Graph LSTM Xiaodan Liang, Xiaohui Shen, Jiashi Feng, Liang Lin, Shuicheng Yan

CVPR 2016 Semantic Object Parsing with Local-Global Long Short-Term Memory Xiaodan Liang, Xiaohui Shen, Donglai Xiang, Jiashi Feng, Liang Lin, Shuicheng Yan

NeurIPS 2016 Tree-Structured Reinforcement Learning for Sequential Object Localization Zequn Jie, Xiaodan Liang, Jiashi Feng, Xiaojie Jin, Wen Lu, Shuicheng Yan

ICCV 2015 Human Parsing with Contextualized Convolutional Neural Network Xiaodan Liang, Chunyan Xu, Xiaohui Shen, Jianchao Yang, Si Liu, Jinhui Tang, Liang Lin, Shuicheng Yan

CVPR 2015 Matching-CNN Meets KNN: Quasi-Parametric Human Parsing Si Liu, Xiaodan Liang, Luoqi Liu, Xiaohui Shen, Jianchao Yang, Changsheng Xu, Liang Lin, Xiaochun Cao, Shuicheng Yan

ICCV 2015 Towards Computational Baby Learning: A Weakly-Supervised Approach for Object Detection Xiaodan Liang, Si Liu, Yunchao Wei, Luoqi Liu, Liang Lin, Shuicheng Yan