Lan, Shiyi

21 publications

ICLR 2026 ChronoEdit: Towards Temporal Reasoning for In-Context Image Editing and World Simulation Jay Zhangjie Wu, Xuanchi Ren, Tianchang Shen, Tianshi Cao, Kai He, Yifan Lu, Ruiyuan Gao, Enze Xie, Shiyi Lan, Jose M. Alvarez, Jun Gao, Sanja Fidler, Zian Wang, Huan Ling

ICLR 2026 Play to Generalize: Learning to Reason Through Game Play Yunfei Xie, Yinsong Ma, Shiyi Lan, Alan Yuille, Junfei Xiao, Chen Wei

ICCV 2025 Hydra-NeXt: Robust Closed-Loop Driving with Open-Loop Training Zhenxin Li, Shihao Wang, Shiyi Lan, Zhiding Yu, Zuxuan Wu, Jose M. Alvarez

CVPR 2025 MDP: Multidimensional Vision Model Pruning with Latency Constraint Xinglong Sun, Barath Lakshmanan, Maying Shen, Shiyi Lan, Jingde Chen, Jose M. Alvarez

CVPR 2025 OmniDrive: A Holistic Vision-Language Dataset for Autonomous Driving with Counterfactual Reasoning Shihao Wang, Zhiding Yu, Xiaohui Jiang, Shiyi Lan, Min Shi, Nadine Chang, Jan Kautz, Ying Li, Jose M. Alvarez

ECCV 2024 A Semantic Space Is Worth 256 Language Descriptions: Make Stronger Segmentation Models with Descriptive Properties Junfei Xiao, Ziqi Zhou, Wenxuan Li, Shiyi Lan, Jieru Mei, Zhiding Yu, Bingchen Zhao, Alan Yuille, Yuyin Zhou, Cihang Xie

CVPR 2024 BEVNeXt: Reviving Dense BEV Frameworks for 3D Object Detection Zhenxin Li, Shiyi Lan, Jose M. Alvarez, Zuxuan Wu

CVPR 2024 Is Ego Status All You Need for Open-Loop End-to-End Autonomous Driving? Zhiqi Li, Zhiding Yu, Shiyi Lan, Jiahan Li, Jan Kautz, Tong Lu, Jose M. Alvarez

ECCV 2024 SEGIC: Unleashing the Emergent Correspondence for In-Context Segmentation Lingchen Meng, Shiyi Lan, Hengduo Li, Jose M Alvarez, Zuxuan Wu, Yu-Gang Jiang

CVPR 2024 Synthesize Diagnose and Optimize: Towards Fine-Grained Vision-Language Understanding Wujian Peng, Sicheng Xie, Zuyao You, Shiyi Lan, Zuxuan Wu

CVPRW 2024 What Is Point Supervision Worth in Video Instance Segmentation? Shuaiyi Huang, De-An Huang, Zhiding Yu, Shiyi Lan, Subhashree Radhakrishnan, José M. Álvarez, Abhinav Shrivastava, Anima Anandkumar

ICCV 2023 FocalFormer3D: Focusing on Hard Instance for 3D Object Detection Yilun Chen, Zhiding Yu, Yukang Chen, Shiyi Lan, Anima Anandkumar, Jiaya Jia, Jose M. Alvarez

ICCV 2023 Fully Attentional Networks with Self-Emerging Token Labeling Bingyin Zhao, Zhiding Yu, Shiyi Lan, Yutao Cheng, Anima Anandkumar, Yingjie Lao, Jose M. Alvarez

CVPR 2023 Vision Transformers Are Good Mask Auto-Labelers Shiyi Lan, Xitong Yang, Zhiding Yu, Zuxuan Wu, Jose M. Alvarez, Anima Anandkumar

CVPR 2022 AdaViT: Adaptive Vision Transformers for Efficient Image Recognition Lingchen Meng, Hengduo Li, Bor-Chun Chen, Shiyi Lan, Zuxuan Wu, Yu-Gang Jiang, Ser-Nam Lim

WACV 2022 M3DETR: Multi-Representation, Multi-Scale, Mutual-Relation 3D Object Detection with Transformers Tianrui Guan, Jun Wang, Shiyi Lan, Rohan Chandra, Zuxuan Wu, Larry Davis, Dinesh Manocha

ICCV 2021 DiscoBox: Weakly Supervised Instance Segmentation and Semantic Correspondence from Box Supervision Shiyi Lan, Zhiding Yu, Christopher Choy, Subhashree Radhakrishnan, Guilin Liu, Yuke Zhu, Larry S. Davis, Anima Anandkumar

ECCV 2020 InfoFocus: 3D Object Detection for Autonomous Driving with Dynamic Information Modeling Jun Wang, Shiyi Lan, Mingfei Gao, Larry S. Davis

CVPR 2020 SaccadeNet: A Fast and Accurate Object Detector Shiyi Lan, Zhou Ren, Yi Wu, Larry S. Davis, Gang Hua

CVPR 2019 Modeling Local Geometric Structure of 3D Point Clouds Using Geo-CNN Shiyi Lan, Ruichi Yu, Gang Yu, Larry S. Davis

CVPR 2017 FastMask: Segment Multi-Scale Object Candidates in One Shot Hexiang Hu, Shiyi Lan, Yuning Jiang, Zhimin Cao, Fei Sha