Zhao, Bin

47 publications

ICCV 2025 AerialVG: A Challenging Benchmark for Aerial Visual Grounding by Exploring Positional Relations Junli Liu, Qizhi Chen, Zhigang Wang, Yiwen Tang, Yiting Zhang, Chi Yan, Dong Wang, Xuelong Li, Bin Zhao

TMLR 2025 Decentralized Transformers with Centralized Aggregation Are Sample-Efficient Multi-Agent World Models Yang Zhang, Chenjia Bai, Bin Zhao, Junchi Yan, Xiu Li, Xuelong Li

ICLRW 2025 Decentralized Transformers with Centralized Aggregation Are Sample-Efficient Multi-Agent World Models Yang Zhang, Chenjia Bai, Bin Zhao, Junchi Yan, Xiu Li, Xuelong Li

CVPR 2025 Efficient Diffusion as Low Light Enhancer Guanzhou Lan, Qianli Ma, Yuqi Yang, Zhigang Wang, Dong Wang, Xuelong Li, Bin Zhao

CoRL 2025 FastUMI: A Scalable and Hardware-Independent Universal Manipulation Interface with Dataset Zhaxizhuom Zhaxizhuoma, Kehui Liu, Chuyue Guan, Zhongjie Jia, Ziniu Wu, Xin Liu, Tianyu Wang, Shuai Liang, Pengan Chen, Pingrui Zhang, Haoming Song, Delin Qu, Dong Wang, Zhigang Wang, Nieqing Cao, Yan Ding, Bin Zhao, Xuelong Li

AAAI 2025 Learning 2D Invariant Affordance Knowledge for 3D Affordance Grounding Xianqiang Gao, Pingrui Zhang, Delin Qu, Dong Wang, Zhigang Wang, Yan Ding, Bin Zhao

ICCV 2025 MoMa-Kitchen: A 100k+ Benchmark for Affordance-Grounded Last-Mile Navigation in Mobile Manipulation Pingrui Zhang, Xianqiang Gao, Yuhan Wu, Kehui Liu, Dong Wang, Zhigang Wang, Bin Zhao, Yan Ding, Xuelong Li

ICCV 2025 Open-Vocabulary Octree-Graph for 3D Scene Understanding Zhigang Wang, Yifei Su, Chenhui Li, Dong Wang, Yan Huang, Xuelong Li, Bin Zhao

CVPR 2025 Think Small, Act Big: Primitive Prompt Learning for Lifelong Robot Manipulation Yuanqi Yao, Siao Liu, Haoming Song, Delin Qu, Qizhi Chen, Yan Ding, Bin Zhao, Zhigang Wang, Xuelong Li, Dong Wang

ECCV 2024 Any2Point: Empowering Any-Modality Transformers for Efficient 3D Understanding Yiwen Tang, Ray Zhang, Jiaming Liu, Zoey Guo, Bin Zhao, Zhigang Wang, Dong Wang, Peng Gao, Hongsheng Li, Xuelong Li

AAAI 2024 Color Event Enhanced Single-Exposure HDR Imaging Mengyao Cui, Zhigang Wang, Dong Wang, Bin Zhao, Xuelong Li

CVPR 2024 Cyclic Learning for Binaural Audio Generation and Localization Zhaojian Li, Bin Zhao, Yuan Yuan

CVPR 2024 GS-SLAM: Dense Visual SLAM with 3D Gaussian Splatting Chi Yan, Delin Qu, Dan Xu, Bin Zhao, Zhigang Wang, Dong Wang, Xuelong Li

CVPR 2024 HPL-ESS: Hybrid Pseudo-Labeling for Unsupervised Event-Based Semantic Segmentation Linglin Jing, Yiming Ding, Yunpeng Gao, Zhigang Wang, Xu Yan, Dong Wang, Gerald Schaefer, Hui Fang, Bin Zhao, Xuelong Li

CVPR 2024 Implicit Event-RGBD Neural SLAM Delin Qu, Chi Yan, Dong Wang, Jie Yin, Qizhi Chen, Dan Xu, Yiting Zhang, Bin Zhao, Xuelong Li

CoRL 2024 KOI: Accelerating Online Imitation Learning via Hybrid Key-State Guidance Jingxian Lu, Wenke Xia, Dong Wang, Zhigang Wang, Bin Zhao, Di Hu, Xuelong Li

NeurIPS 2024 Learning an Actionable Discrete Diffusion Policy via Large-Scale Actionless Video Pre-Training Haoran He, Chenjia Bai, Ling Pan, Weinan Zhang, Bin Zhao, Xuelong Li

NeurIPS 2024 LiveScene: Language Embedding Interactive Radiance Fields for Physical Scene Control and Rendering Delin Qu, Qizhi Chen, Pingrui Zhang, Xianqiang Gao, Bin Zhao, Zhigang Wang, Dong Wang, Xuelong Li

AAAI 2024 Point-PEFT: Parameter-Efficient Fine-Tuning for 3D Pre-Trained Models Yiwen Tang, Ray Zhang, Zoey Guo, Xianzheng Ma, Bin Zhao, Zhigang Wang, Dong Wang, Xuelong Li

ICML 2024 SAM-E: Leveraging Visual Foundation Model with Sequence Imitation for Embodied Manipulation Junjie Zhang, Chenjia Bai, Haoran He, Zhigang Wang, Bin Zhao, Xiu Li, Xuelong Li

AAAI 2024 X4D-SceneFormer: Enhanced Scene Understanding on 4D Point Cloud Videos Through Cross-Modal Knowledge Transfer Linglin Jing, Ying Xue, Xu Yan, Chaoda Zheng, Dong Wang, Ruimao Zhang, Zhigang Wang, Hui Fang, Bin Zhao, Zhen Li

CoRL 2023 Affordance-Driven Next-Best-View Planning for Robotic Grasping Xuechao Zhang, Dong Wang, Sun Han, Weichuang Li, Bin Zhao, Zhigang Wang, Xiaoming Duan, Chongrong Fang, Xuelong Li, Jianping He

ICML 2023 Behavior Contrastive Learning for Unsupervised Skill Discovery Rushuai Yang, Chenjia Bai, Hongyi Guo, Siyuan Li, Bin Zhao, Zhen Wang, Peng Liu, Xuelong Li

NeurIPS 2023 Cross-Domain Policy Adaptation via Value-Guided Data Filtering Kang Xu, Chenjia Bai, Xiaoteng Ma, Dong Wang, Bin Zhao, Zhen Wang, Xuelong Li, Wei Li

NeurIPS 2023 Diffusion Model Is an Effective Planner and Data Synthesizer for Multi-Task Reinforcement Learning Haoran He, Chenjia Bai, Kang Xu, Zhuoran Yang, Weinan Zhang, Dong Wang, Bin Zhao, Xuelong Li

CVPR 2023 Fully Self-Supervised Depth Estimation from Defocus Clue Haozhe Si, Bin Zhao, Dong Wang, Yunpeng Gao, Mulin Chen, Zhigang Wang, Xuelong Li

ICCV 2023 Not All Features Matter: Enhancing Few-Shot CLIP with Adaptive Prior Refinement Xiangyang Zhu, Renrui Zhang, Bowei He, Aojun Zhou, Dong Wang, Bin Zhao, Peng Gao

CVPR 2023 One-Shot High-Fidelity Talking-Head Synthesis with Deformable Neural Radiance Field Weichuang Li, Longhao Zhang, Dong Wang, Bin Zhao, Zhigang Wang, Mulin Chen, Bang Zhang, Zhongjian Wang, Liefeng Bo, Xuelong Li

CVPR 2023 Propagate and Calibrate: Real-Time Passive Non-Line-of-Sight Tracking Yihao Wang, Zhigang Wang, Bin Zhao, Dong Wang, Mulin Chen, Xuelong Li

ICCV 2023 Towards Nonlinear-Motion-Aware and Occlusion-Robust Rolling Shutter Correction Delin Qu, Yizhen Lao, Zhigang Wang, Dong Wang, Bin Zhao, Xuelong Li

ICCV 2023 ViewRefer: Grasp the Multi-View Knowledge for 3D Visual Grounding Zoey Guo, Yiwen Tang, Ray Zhang, Dong Wang, Zhigang Wang, Bin Zhao, Xuelong Li

NeurIPS 2022 Point-M2AE: Multi-Scale Masked Autoencoders for Hierarchical Point Cloud Pre-Training Renrui Zhang, Ziyu Guo, Peng Gao, Rongyao Fang, Bin Zhao, Dong Wang, Yu Qiao, Hongsheng Li

ECCV 2022 RCLane: Relay Chain Prediction for Lane Detection Shenghua Xu, Xinyue Cai, Bin Zhao, Li Zhang, Hang Xu, Yanwei Fu, Xiangyang Xue

ICCV 2021 Generating Masks from Boxes by Mining Spatio-Temporal Consistencies in Videos Bin Zhao, Goutam Bhat, Martin Danelljan, Luc Van Gool, Radu Timofte

CVPR 2021 PSRR-MaxpoolNMS: Pyramid Shifted MaxpoolNMS with Relationship Recovery Tianyi Zhang, Jie Lin, Peng Hu, Bin Zhao, Mohamed M. Sabry Aly

IJCAI 2019 Travel Time Estimation Without Road Networks: An Urban Morphological Layout Representation Approach Wuwei Lan, Yanyan Xu, Bin Zhao

IJCAI 2018 Video Captioning with Tube Features Bin Zhao, Xuelong Li, Xiaoqiang Lu

IJCAI 2017 MAM-RNN: Multi-Level Attention Model Based RNN for Video Captioning Xuelong Li, Bin Zhao, Xiaoqiang Lu

WACV 2015 Visual Saliency Models Based on Spectrum Processing Bin Zhao, Edward J. Delp

CVPR 2014 Hierarchical Feature Hashing for Fast Dimensionality Reduction Bin Zhao, Eric P. Xing

CVPR 2014 Quasi Real-Time Summarization for Consumer Videos Bin Zhao, Eric P. Xing

CVPR 2013 Sparse Output Coding for Large-Scale Visual Recognition Bin Zhao, Eric P. Xing

NeurIPS 2011 Large-Scale Category Structure Aware Image Categorization Bin Zhao, Fei Li, Eric P. Xing

CVPR 2011 Online Detection of Unusual Events in Videos via Dynamic Sparse Coding Bin Zhao, Li Fei-Fei, Eric P. Xing

ECCV 2010 Image Segmentation with Topic Random Field Bin Zhao, Li Fei-Fei, Eric P. Xing

CVPR 2009 Unsupervised Maximum Margin Feature Selection with Manifold Regularization Bin Zhao, James Tin-Yau Kwok, Fei Wang, Changshui Zhang

ICML 2008 Efficient Multiclass Maximum Margin Clustering Bin Zhao, Fei Wang, Changshui Zhang