Li, Boyi

32 publications

ICCV 2025 Bias in Gender Bias Benchmarks: How Spurious Features Distort Evaluation Yusuke Hirota, Ryo Hachiuma, Boyi Li, Ximing Lu, Michael Ross Boone, Boris Ivanovic, Yejin Choi, Marco Pavone, Yu-Chiang Frank Wang, Noa Garcia, Yuta Nakashima, Chao-Han Huck Yang

ICCV 2025 Describe Anything: Detailed Localized Image and Video Captioning Long Lian, Yifan Ding, Yunhao Ge, Sifei Liu, Hanzi Mao, Boyi Li, Marco Pavone, Ming-Yu Liu, Trevor Darrell, Adam Yala, Yin Cui

ICCV 2025 Extrapolated Urban View Synthesis Benchmark Xiangyu Han, Zhen Jia, Boyi Li, Yan Wang, Boris Ivanovic, Yurong You, Lingjie Liu, Yue Wang, Marco Pavone, Chen Feng, Yiming Li

TMLR 2025 Interactive Task Planning with Language Models Boyi Li, Philipp Wu, Pieter Abbeel, Jitendra Malik

ICLR 2025 Language-Image Models with 3D Understanding Jang Hyun Cho, Boris Ivanovic, Yulong Cao, Edward Schmerling, Yue Wang, Xinshuo Weng, Boyi Li, Yurong You, Philipp Kraehenbuehl, Yan Wang, Marco Pavone

ICLR 2025 LoRA3D: Low-Rank Self-Calibration of 3D Geometric Foundation Models Ziqi Lu, Heng Yang, Danfei Xu, Boyi Li, Boris Ivanovic, Marco Pavone, Yue Wang

ICLR 2025 PhysBench: Benchmarking and Enhancing Vision-Language Models for Physical World Understanding Wei Chow, Jiageng Mao, Boyi Li, Daniel Seita, Vitor Campagnolo Guizilini, Yue Wang

ICLRW 2025 PhysBench: Benchmarking and Enhancing Vision-Language Models for Physical World Understanding Wei Chow, Jiageng Mao, Boyi Li, Daniel Seita, Vitor Campagnolo Guizilini, Yue Wang

ICLR 2025 STORM: Spatio-TempOral Reconstruction Model for Large-Scale Outdoor Scenes Jiawei Yang, Jiahui Huang, Boris Ivanovic, Yuxiao Chen, Yan Wang, Boyi Li, Yurong You, Apoorva Sharma, Maximilian Igl, Peter Karkus, Danfei Xu, Yue Wang, Marco Pavone

CVPR 2025 Scaling Vision Pre-Training to 4k Resolution Baifeng Shi, Boyi Li, Han Cai, Yao Lu, Sifei Liu, Marco Pavone, Jan Kautz, Song Han, Trevor Darrell, Pavlo Molchanov, Hongxu Yin

CoRL 2025 The Sound of Simulation: Learning Multimodal Sim-to-Real Robot Policies with Generative Audio Renhao Wang, Haoran Geng, Tingle Li, Philipp Wu, Feishi Wang, Gopala Anumanchipalli, Trevor Darrell, Boyi Li, Pieter Abbeel, Jitendra Malik, Alexei A Efros

TMLR 2025 Wolf: Dense Video Captioning with a World Summarization Framework Boyi Li, Ligeng Zhu, Ran Tian, Shuhan Tan, Yuxiao Chen, Yao Lu, Yin Cui, Sushant Veer, Max Ehrlich, Jonah Philion, Xinshuo Weng, Fuzhao Xue, Linxi Fan, Yuke Zhu, Jan Kautz, Andrew Tao, Ming-Yu Liu, Sanja Fidler, Boris Ivanovic, Trevor Darrell, Jitendra Malik, Song Han, Marco Pavone

NeurIPS 2024 DiffuBox: Refining 3D Object Detection with Point Diffusion Xiangyu Chen, Zhenzhen Liu, Katie Z Luo, Siddhartha Datta, Adhitya Polavaram, Yan Wang, Yurong You, Boyi Li, Marco Pavone, Wei-Lun Chao, Mark Campbell, Bharath Hariharan, Kilian Q. Weinberger

CVPR 2024 Driving Everywhere with Large Language Model Policy Adaptation Boyi Li, Yue Wang, Jiageng Mao, Boris Ivanovic, Sushant Veer, Karen Leung, Marco Pavone

ICLR 2024 Efficient Video Diffusion Models via Content-Frame Motion-Latent Decomposition Sihyun Yu, Weili Nie, De-An Huang, Boyi Li, Jinwoo Shin, Anima Anandkumar

ICLR 2024 EmerNeRF: Emergent Spatial-Temporal Scene Decomposition via Self-Supervision Jiawei Yang, Boris Ivanovic, Or Litany, Xinshuo Weng, Seung Wook Kim, Boyi Li, Tong Che, Danfei Xu, Sanja Fidler, Marco Pavone, Yue Wang

TMLR 2024 LLM-Grounded Diffusion: Enhancing Prompt Understanding of Text-to-Image Diffusion Models with Large Language Models Long Lian, Boyi Li, Adam Yala, Trevor Darrell

ICLR 2024 LLM-Grounded Video Diffusion Models Long Lian, Baifeng Shi, Adam Yala, Trevor Darrell, Boyi Li

CoRL 2024 Promptable Closed-Loop Traffic Simulation Shuhan Tan, Boris Ivanovic, Yuxiao Chen, Boyi Li, Xinshuo Weng, Yulong Cao, Philipp Kraehenbuehl, Marco Pavone

ECCV 2024 See and Think: Embodied Agent in Virtual Environment Zhonghan Zhao, Xuan Wang, Wenhao Chai, Boyi Li, Shengyu Hao, Shidong Cao, Tian Ye, Gaoang Wang

CVPR 2024 Self-Correcting LLM-Controlled Diffusion Models Tsung-Han Wu, Long Lian, Joseph E. Gonzalez, Boyi Li, Trevor Darrell

CoRL 2024 Tokenize the World into Object-Level Knowledge to Address Long-Tail Events in Autonomous Driving Thomas Tian, Boyi Li, Xinshuo Weng, Yuxiao Chen, Edward Schmerling, Yue Wang, Boris Ivanovic, Marco Pavone

NeurIPSW 2024 Wolf: Captioning Everything with a World Summarization Framework Boyi Li, Ligeng Zhu, Ran Tian, Shuhan Tan, Yuxiao Chen, Yao Lu, Yin Cui, Sushant Veer, Max Ehrlich, Jonah Philion, Xinshuo Weng, Fuzhao Xue, Andrew Tao, Ming-Yu Liu, Sanja Fidler, Boris Ivanovic, Trevor Darrell, Jitendra Malik, Song Han, Marco Pavone

NeurIPS 2023 Geometry-Informed Neural Operator for Large-Scale 3D PDEs Zongyi Li, Nikola Kovachki, Chris Choy, Boyi Li, Jean Kossaifi, Shourya Otta, Mohammad Amin Nabian, Maximilian Stadler, Christian Hundt, Kamyar Azizzadenesheli, Animashree Anandkumar

ICLR 2022 Fixed Neural Network Steganography: Train the Images, Not the Network Varsha Kishore, Xiangyu Chen, Yan Wang, Boyi Li, Kilian Q Weinberger

ICLR 2022 Language-Driven Semantic Segmentation Boyi Li, Kilian Q Weinberger, Serge Belongie, Vladlen Koltun, Rene Ranftl

CVPRW 2022 Neural Image Recolorization for Creative Domains Boyi Li, Serge J. Belongie, Ser-Nam Lim, Abe Davis

ECCVW 2022 SITTA: Single Image Texture Translation for Data Augmentation Boyi Li, Yin Cui, Tsung-Yi Lin, Serge J. Belongie

CVPR 2021 On Feature Normalization and Data Augmentation Boyi Li, Felix Wu, Ser-Nam Lim, Serge Belongie, Kilian Q. Weinberger

NeurIPS 2019 Positional Normalization Boyi Li, Felix Wu, Kilian Q. Weinberger, Serge Belongie

AAAI 2018 End-to-End United Video Dehazing and Detection Boyi Li, Xiulian Peng, Zhangyang Wang, Jizheng Xu, Dan Feng

ICCV 2017 AOD-Net: All-in-One Dehazing Network Boyi Li, Xiulian Peng, Zhangyang Wang, Jizheng Xu, Dan Feng