Wang, Tai

33 publications

CVPR 2025 GENMANIP: LLM-Driven Simulation for Generalizable Instruction-Following Manipulation Ning Gao, Yilun Chen, Shuai Yang, Xinyi Chen, Yang Tian, Hao Li, Haifeng Huang, Hanqing Wang, Tai Wang, Jiangmiao Pang

ICCV 2025 GLEAM: Learning Generalizable Exploration Policy for Active Mapping in Complex 3D Indoor Scene Xiao Chen, Tai Wang, Quanyi Li, Tao Huang, Jiangmiao Pang, Tianfan Xue

NeurIPS 2025 InternScenes: A Large-Scale Simulatable Indoor Scene Dataset with Realistic Layouts Weipeng Zhong, Peizhou Cao, Yichen Jin, Luo Li, Wenzhe Cai, Jingli Lin, Hanqing Wang, Zhaoyang Lyu, Tai Wang, Xudong Xu, Bo Dai, Jiangmiao Pang

ICCV 2025 LLaVA-3D: A Simple yet Effective Pathway to Empowering LMMs with 3D Capabilities Chenming Zhu, Tai Wang, Wenwei Zhang, Jiangmiao Pang, Xihui Liu

NeurIPS 2025 LabUtopia: High-Fidelity Simulation and Hierarchical Benchmark for Scientific Embodied Agents Rui Li, Zixuan Hu, Wenxi Qu, Jinouwen Zhang, Zhenfei Yin, Sha Zhang, Xuantuo Huang, Hanqing Wang, Tai Wang, Jiangmiao Pang, Wanli Ouyang, Lei Bai, Wangmeng Zuo, Lingyu Duan, Dongzhan Zhou, Shixiang Tang

NeurIPS 2025 OST-Bench: Evaluating the Capabilities of MLLMs in Online Spatio-Temporal Scene Understanding Jingli Lin, Chenming Zhu, Runsen Xu, Xiaohan Mao, Xihui Liu, Tai Wang, Jiangmiao Pang

ICCV 2025 Rethinking the Embodied Gap in Vision-and-Language Navigation: A Holistic Study of Physical and Visual Disparities Liuyi Wang, Xinyuan Xia, Hui Zhao, Hanqing Wang, Tai Wang, Yilun Chen, Chengju Liu, Qijun Chen, Jiangmiao Pang

CVPR 2025 RoboGround: Robotic Manipulation with Grounded Vision-Language Priors Haifeng Huang, Xinyi Chen, Yilun Chen, Hao Li, Xiaoshen Han, Zehan Wang, Tai Wang, Jiangmiao Pang, Zhou Zhao

ICCV 2025 VFlowOpt: A Token Pruning Framework for LMMs with Visual Information Flow-Guided Optimization Sihan Yang, Runsen Xu, Chenhang Cui, Tai Wang, Dahua Lin, Jiangmiao Pang

NeurIPS 2024 Chat-Scene: Bridging 3D Scene and Large Language Models with Object Identifiers Haifeng Huang, Yilun Chen, Zehan Wang, Rongjie Huang, Runsen Xu, Tai Wang, Luping Liu, Xize Cheng, Yang Zhao, Jiangmiao Pang, Zhou Zhao

NeurIPS 2024 CooHOI: Learning Cooperative Human-Object Interaction with Manipulated Object Dynamics Jiawei Gao, Ziqin Wang, Zeqi Xiao, Jingbo Wang, Tai Wang, Jinkun Cao, Xiaolin Hu, Si Liu, Jifeng Dai, Jiangmiao Pang

CVPR 2024 EmbodiedScan: A Holistic Multi-Modal 3D Perception Suite Towards Embodied AI Tai Wang, Xiaohan Mao, Chenming Zhu, Runsen Xu, Ruiyuan Lyu, Peisen Li, Xiao Chen, Wenwei Zhang, Kai Chen, Tianfan Xue, Xihui Liu, Cewu Lu, Dahua Lin, Jiangmiao Pang

CVPR 2024 GenNBV: Generalizable Next-Best-View Policy for Active 3D Reconstruction Xiao Chen, Quanyi Li, Tai Wang, Tianfan Xue, Jiangmiao Pang

ECCV 2024 Learning to Adapt SAM for Segmenting Cross-Domain Point Clouds Xidong Peng, Runnan Chen, Feng Qiao, Lingdong Kong, Youquan Liu, Yujing Sun, Tai Wang, Xinge Zhu, Yuexin Ma

NeurIPS 2024 MMScan: A Multi-Modal 3D Scene Dataset with Hierarchical Grounded Language Annotations Ruiyuan Lyu, Jingli Lin, Tai Wang, Shuai Yang, Xiaohan Mao, Yilun Chen, Runsen Xu, Haifeng Huang, Chenming Zhu, Dahua Lin, Jiangmiao Pang

NeurIPS 2024 OctreeOcc: Efficient and Multi-Granularity Occupancy Prediction Using Octree Queries Yuhang Lu, Xinge Zhu, Tai Wang, Yuexin Ma

ECCV 2024 Omni6D: Large-Vocabulary 3D Object Dataset for Category-Level 6d Object Pose Estimation Mengchen Zhang, Tong Wu, Tai Wang, Tengfei Wang, Ziwei Liu, Dahua Lin

ECCV 2024 PointLLM: Empowering Large Language Models to Understand Point Clouds Runsen Xu, Xiaolong Wang, Tai Wang, Yilun Chen, Jiangmiao Pang, Dahua Lin

ECCV 2024 ScanReason: Empowering 3D Visual Grounding with Reasoning Capabilities Chenming Zhu, Tai Wang, Wenwei Zhang, Kai Chen, Xihui Liu

ICLR 2024 Unified Human-Scene Interaction via Prompted Chain-of-Contacts Zeqi Xiao, Tai Wang, Jingbo Wang, Jinkun Cao, Wenwei Zhang, Bo Dai, Dahua Lin, Jiangmiao Pang

CoRL 2024 VLM-Grounder: A VLM Agent for Zero-Shot 3D Visual Grounding Runsen Xu, Zhiwei Huang, Tai Wang, Yilun Chen, Jiangmiao Pang, Dahua Lin

CoRL 2023 DORT: Modeling Dynamic Objects in Recurrent for Multi-Camera 3D Object Detection and Tracking Qing Lian, Tai Wang, Dahua Lin, Jiangmiao Pang

ICCV 2023 GeoMIM: Towards Better 3D Knowledge Transfer via Masked Image Modeling for Multi-View 3D Understanding Jihao Liu, Tai Wang, Boxiao Liu, Qihang Zhang, Yu Liu, Hongsheng Li

CVPR 2023 MV-JAR: Masked Voxel Jigsaw and Reconstruction for LiDAR-Based Self-Supervised Pre-Training Runsen Xu, Tai Wang, Wenwei Zhang, Runjian Chen, Jinkun Cao, Jiangmiao Pang, Dahua Lin

ICCV 2023 MonoDETR: Depth-Guided Transformer for Monocular 3D Object Detection Renrui Zhang, Han Qiu, Tai Wang, Ziyu Guo, Ziteng Cui, Yu Qiao, Hongsheng Li, Peng Gao

ICCV 2023 Scene as Occupancy Wenwen Tong, Chonghao Sima, Tai Wang, Li Chen, Silei Wu, Hanming Deng, Yi Gu, Lewei Lu, Ping Luo, Dahua Lin, Hongyang Li

ECCV 2022 Monocular 3D Object Detection with Depth from Motion Tai Wang, Jiangmiao Pang, Dahua Lin

WACV 2022 SIDE: Center-Based Stereo 3D Detector with Structure-Aware Instance Depth Estimation Xidong Peng, Xinge Zhu, Tai Wang, Yuexin Ma

NeurIPS 2021 Balanced Chamfer Distance as a Comprehensive Metric for Point Cloud Completion Tong Wu, Liang Pan, Junzhe Zhang, Tai Wang, Ziwei Liu, Dahua Lin

CVPR 2021 Cylindrical and Asymmetrical 3D Convolution Networks for LiDAR Segmentation Xinge Zhu, Hui Zhou, Tai Wang, Fangzhou Hong, Yuexin Ma, Wei Li, Hongsheng Li, Dahua Lin

ICCVW 2021 FCOS3D: Fully Convolutional One-Stage Monocular 3D Object Detection Tai Wang, Xinge Zhu, Jiangmiao Pang, Dahua Lin

CoRL 2021 Probabilistic and Geometric Depth: Detecting Objects in Perspective Tai Wang, Xinge Zhu, Jiangmiao Pang, Dahua Lin

CoRL 2020 Reconfigurable Voxels: A New Representation for LiDAR-Based Point Clouds Tai Wang, Xinge Zhu, Dahua Lin