Lin, Dahua

208 publications

CVPR 2025 3DTopia-XL: Scaling High-Quality 3D Asset Generation via Primitive Diffusion Zhaoxi Chen, Jiaxiang Tang, Yuhao Dong, Ziang Cao, Fangzhou Hong, Yushi Lan, Tengfei Wang, Haozhe Xie, Tong Wu, Shunsuke Saito, Liang Pan, Dahua Lin, Ziwei Liu

ICLR 2025 3DTrajMaster: Mastering 3D Trajectory for Multi-Entity Motion in Video Generation Xiao Fu, Xian Liu, Xintao Wang, Sida Peng, Menghan Xia, Xiaoyu Shi, Ziyang Yuan, Pengfei Wan, Di Zhang, Dahua Lin

ICCV 2025 Bootstrap3D: Improving Multi-View Diffusion Model with Synthetic Data Zeyi Sun, Tong Wu, Pan Zhang, Yuhang Zang, Xiaoyi Dong, Yuanjun Xiong, Dahua Lin, Jiaqi Wang

CVPR 2025 ByTheWay: Boost Your Text-to-Video Generation Model to Higher Quality in a Training-Free Way Jiazi Bu, Pengyang Ling, Pan Zhang, Tong Wu, Xiaoyi Dong, Yuhang Zang, Yuhang Cao, Dahua Lin, Jiaqi Wang

CVPR 2025 Conical Visual Concentration for Efficient Large Vision-Language Models Long Xing, Qidong Huang, Xiaoyi Dong, Jiajie Lu, Pan Zhang, Yuhang Zang, Yuhang Cao, Conghui He, Jiaqi Wang, Feng Wu, Dahua Lin

ICCV 2025 Creation-MMBench: Assessing Context-Aware Creative Intelligence in MLLMs Xinyu Fang, Zhijian Chen, Kai Lan, Lixin Ma, Shengyuan Ding, Yingji Liang, Xiangyu Zhao, Farong Wen, Zicheng Zhang, Guofeng Zhang, Haodong Duan, Kai Chen, Dahua Lin

CVPR 2025 Dispider: Enabling Video LLMs with Active Real-Time Interaction via Disentangled Perception, Decision, and Reaction Rui Qian, Shuangrui Ding, Xiaoyi Dong, Pan Zhang, Yuhang Zang, Yuhang Cao, Dahua Lin, Jiaqi Wang

ICCV 2025 GenDoP: Auto-Regressive Camera Trajectory Generation as a Director of Photography Mengchen Zhang, Tong Wu, Jing Tan, Ziwei Liu, Gordon Wetzstein, Dahua Lin

NeurIPS 2025 Hi3DEval: Advancing 3D Generation Evaluation with Hierarchical Validity Yuhan Zhang, Long Zhuo, Ziyang Chu, Tong Wu, Zhibing Li, Liang Pan, Dahua Lin, Ziwei Liu

NeurIPS 2025 HiFlow: Training-Free High-Resolution Image Generation with Flow-Aligned Guidance Jiazi Bu, Pengyang Ling, Yujie Zhou, Pan Zhang, Tong Wu, Xiaoyi Dong, Yuhang Zang, Yuhang Cao, Dahua Lin, Jiaqi Wang

NeurIPS 2025 Hierachical Balance Packing: Towards Efficient Supervised Fine-Tuning for Long-Context LLM Yongqiang Yao, Jingru Tan, Kaihuan Liang, Feizhao Zhang, Jiahao Hu, Shuo Wu, Yazhe Niu, Ruihao Gong, Dahua Lin, Ningyi Xu

CVPR 2025 Horizon-GS: Unified 3D Gaussian Splatting for Large-Scale Aerial-to-Ground Scenes Lihan Jiang, Kerui Ren, Mulin Yu, Linning Xu, Junting Dong, Tao Lu, Feng Zhao, Dahua Lin, Bo Dai

ICLR 2025 IDArb: Intrinsic Decomposition for Arbitrary Number of Input Views and Illuminations Zhibing Li, Tong Wu, Jing Tan, Mengchen Zhang, Jiaqi Wang, Dahua Lin

NeurIPS 2025 Imagine360: Immersive 360 Video Generation from Perspective Anchor Jing Tan, Shuai Yang, Tong Wu, Jingwen He, Yuwei Guo, Ziwei Liu, Dahua Lin

CVPR 2025 Keyframe-Guided Creative Video Inpainting Yuwei Guo, Ceyuan Yang, Anyi Rao, Chenlin Meng, Omer Bar-Tal, Shuangrui Ding, Maneesh Agrawala, Dahua Lin, Bo Dai

ICCV 2025 LEGION: Learning to Ground and Explain for Synthetic Image Detection Hengrui Kang, Siwei Wen, Zichen Wen, Junyan Ye, Weijia Li, Peilin Feng, Baichuan Zhou, Bin Wang, Dahua Lin, Linfeng Zhang, Conghui He

ICLR 2025 LOKI: A Comprehensive Synthetic Data Detection Benchmark Using Large Multimodal Models Junyan Ye, Baichuan Zhou, Zilong Huang, Junan Zhang, Tianyi Bai, Hengrui Kang, Jun He, Honglin Lin, Zihao Wang, Tong Wu, Zhizheng Wu, Yiping Chen, Dahua Lin, Conghui He, Weijia Li

ICCV 2025 Long Context Tuning for Video Generation Yuwei Guo, Ceyuan Yang, Ziyan Yang, Zhibei Ma, Zhijie Lin, Zhenheng Yang, Dahua Lin, Lu Jiang

ICLR 2025 MIA-DPO: Multi-Image Augmented Direct Preference Optimization for Large Vision-Language Models Ziyu Liu, Yuhang Zang, Xiaoyi Dong, Pan Zhang, Yuhang Cao, Haodong Duan, Conghui He, Yuanjun Xiong, Dahua Lin, Jiaqi Wang

ICCV 2025 MM-IFEngine: Towards Multimodal Instruction Following Shengyuan Ding, Shenxi Wu, Xiangyu Zhao, Yuhang Zang, Haodong Duan, Xiaoyi Dong, Pan Zhang, Yuhang Cao, Dahua Lin, Jiaqi Wang

ICLR 2025 Mask-DPO: Generalizable Fine-Grained Factuality Alignment of LLMs Yuzhe Gu, Wenwei Zhang, Chengqi Lyu, Dahua Lin, Kai Chen

NeurIPS 2025 Mixing Expert Knowledge: Bring Human Thoughts Back to the Game of Go Yichuan Ma, Linyang Li, Yongkang Chen, Peiji Li, Jiasheng Ye, Qipeng Guo, Dahua Lin, Kai Chen

ICCV 2025 Multi-Identity Human Image Animation with Structural Video Diffusion Zhenzhi Wang, Yixuan Li, Yanhong Zeng, Yuwei Guo, Dahua Lin, Tianfan Xue, Bo Dai

ICML 2025 MxMoE: Mixed-Precision Quantization for MoE with Accuracy and Performance Co-Design Haojie Duanmu, Xiuhong Li, Zhihang Yuan, Size Zheng, Jiangfei Duan, Xingcheng Zhang, Dahua Lin

ICML 2025 OmniBal: Towards Fast Instruction-Tuning for Vision-Language Models via Omniverse Computation Balance Yongqiang Yao, Jingru Tan, Feizhao Zhang, Jiahao Hu, Yazhe Niu, Jin Xin, Bo Li, Pengfei Liu, Ruihao Gong, Dahua Lin, Ningyi Xu

ICLR 2025 OmniCorpus: A Unified Multimodal Corpus of 10 Billion-Level Images Interleaved with Text Qingyun Li, Zhe Chen, Weiyun Wang, Wenhai Wang, Shenglong Ye, Zhenjiang Jin, Guanzhou Chen, Yinan He, Zhangwei Gao, Erfei Cui, Jiashuo Yu, Hao Tian, Jiasheng Zhou, Chao Xu, Bin Wang, Xingjian Wei, Wei Li, Wenjian Zhang, Bo Zhang, Pinlong Cai, Licheng Wen, Xiangchao Yan, Pei Chu, Yi Wang, Min Dou, Changyao Tian, Xizhou Zhu, Lewei Lu, Yushi Chen, Junjun He, Tong Lu, Yali Wang, Limin Wang, Dahua Lin, Yu Qiao, Botian Shi, Conghui He, Jifeng Dai

ICLR 2025 Predictive Inverse Dynamics Models Are Scalable Learners for Robotic Manipulation Yang Tian, Sizhe Yang, Jia Zeng, Ping Wang, Dahua Lin, Hao Dong, Jiangmiao Pang

CVPRW 2025 Proc-GS: Procedural Building Generation for City Assembly with 3D Gaussians Yixuan Li, Xingjian Ran, Linning Xu, Tao Lu, Mulin Yu, Zhenzhi Wang, Yuanbo Xiangli, Dahua Lin, Bo Dai

ICCV 2025 SAM2Long: Enhancing SAM 2 for Long Video Segmentation with a Training-Free Memory Tree Shuangrui Ding, Rui Qian, Xiaoyi Dong, Pan Zhang, Yuhang Zang, Yuhang Cao, Yuwei Guo, Dahua Lin, Jiaqi Wang

NeurIPS 2025 Semi-Off-Policy Reinforcement Learning for Vision-Language Slow-Thinking Reasoning Junhao Shen, Haiteng Zhao, Yuzhe Gu, Songyang Gao, Kuikun Liu, Haian Huang, Jianfei Gao, Dahua Lin, Wenwei Zhang, Kai Chen

ICML 2025 SongGen: A Single Stage Auto-Regressive Transformer for Text-to-Song Generation Zihan Liu, Shuangrui Ding, Zhixiong Zhang, Xiaoyi Dong, Pan Zhang, Yuhang Zang, Yuhang Cao, Dahua Lin, Jiaqi Wang

AAAI 2025 UrBench: A Comprehensive Benchmark for Evaluating Large Multimodal Models in Multi-View Urban Scenarios Baichuan Zhou, Haote Yang, Dairong Chen, Junyan Ye, Tianyi Bai, Jinhua Yu, Songyang Zhang, Dahua Lin, Conghui He, Weijia Li

AAAI 2025 Utilize the Flow Before Stepping into the Same River Twice: Certainty Represented Knowledge Flow for Refusal-Aware Instruction Tuning Runchuan Zhu, Zhipeng Ma, Jiang Wu, Junyuan Gao, Jiaqi Wang, Dahua Lin, Conghui He

ICCV 2025 VFlowOpt: A Token Pruning Framework for LMMs with Visual Information Flow-Guided Optimization Sihan Yang, Runsen Xu, Chenhang Cui, Tai Wang, Dahua Lin, Jiangmiao Pang

NeurIPS 2025 Video World Models with Long-Term Spatial Memory Tong Wu, Shuai Yang, Ryan Po, Yinghao Xu, Ziwei Liu, Dahua Lin, Gordon Wetzstein

ICML 2025 VideoRoPE: What Makes for Good Video Rotary Position Embedding? Xilin Wei, Xiaoran Liu, Yuhang Zang, Xiaoyi Dong, Pan Zhang, Yuhang Cao, Jian Tong, Haodong Duan, Qipeng Guo, Jiaqi Wang, Xipeng Qiu, Dahua Lin

ICCV 2025 Visual-RFT: Visual Reinforcement Fine-Tuning Ziyu Liu, Zeyi Sun, Yuhang Zang, Xiaoyi Dong, Yuhang Cao, Haodong Duan, Dahua Lin, Jiaqi Wang

ICCV 2025 X-Prompt: Generalizable Auto-Regressive Visual Learning with In-Context Prompting Zeyi Sun, Ziyang Chu, Pan Zhang, Tong Wu, Yuhang Zang, Xiaoyi Dong, Yuanjun Xiong, Dahua Lin, Jiaqi Wang

NeurIPS 2024 ANAH-V2: Scaling Analytical Hallucination Annotation of Large Language Models Yuzhe Gu, Ziwei Ji, Wenwei Zhang, Chengqi Lyu, Dahua Lin, Kai Chen

NeurIPS 2024 AlchemistCoder: Harmonizing and Eliciting Code Capability by Hindsight Tuning on Multi-Source Data Zifan Song, Yudong Wang, Wenwei Zhang, Kuikun Liu, Chengqi Lyu, Demin Song, Qipeng Guo, Hang Yan, Dahua Lin, Kai Chen, Cairong Zhao

CVPR 2024 Alpha-CLIP: A CLIP Model Focusing on Wherever You Want Zeyi Sun, Ye Fang, Tong Wu, Pan Zhang, Yuhang Zang, Shu Kong, Yuanjun Xiong, Dahua Lin, Jiaqi Wang

ICLR 2024 AnimateDiff: Animate Your Personalized Text-to-Image Diffusion Models Without Specific Tuning Yuwei Guo, Ceyuan Yang, Anyi Rao, Zhengyang Liang, Yaohui Wang, Yu Qiao, Maneesh Agrawala, Dahua Lin, Bo Dai

NeurIPS 2024 Are We on the Right Way for Evaluating Large Vision-Language Models? Lin Chen, Jinsong Li, Xiaoyi Dong, Pan Zhang, Yuhang Zang, Zehui Chen, Haodong Duan, Jiaqi Wang, Yu Qiao, Dahua Lin, Feng Zhao

ECCV 2024 Betrayed by Attention: A Simple yet Effective Approach for Self-Supervised Video Object Segmentation Shuangrui Ding, Rui Qian, Haohang Xu, Dahua Lin, Hongkai Xiong

CVPR 2024 Cinematic Behavior Transfer via NeRF-Based Differentiable Filming Xuekun Jiang, Anyi Rao, Jingbo Wang, Dahua Lin, Bo Dai

NeurIPS 2024 CriticEval: Evaluating Large-Scale Language Model as Critic Tian Lan, Wenwei Zhang, Chen Xu, Heyan Huang, Dahua Lin, Kai Chen, Xian-Ling Mao

CVPR 2024 EmbodiedScan: A Holistic Multi-Modal 3D Perception Suite Towards Embodied AI Tai Wang, Xiaohan Mao, Chenming Zhu, Runsen Xu, Ruiyuan Lyu, Peisen Li, Xiao Chen, Wenwei Zhang, Kai Chen, Tianfan Xue, Xihui Liu, Cewu Lu, Dahua Lin, Jiangmiao Pang

NeurIPS 2024 FiVA: Fine-Grained Visual Attribute Dataset for Text-to-Image Diffusion Models Tong Wu, Yinghao Xu, Ryan Po, Mengchen Zhang, Guandao Yang, Jiaqi Wang, Ziwei Liu, Dahua Lin, Gordon Wetzstein

CVPR 2024 From Pixels to Graphs: Open-Vocabulary Scene Graph Generation with Vision-Language Models Rongjie Li, Songyang Zhang, Dahua Lin, Kai Chen, Xuming He

CVPR 2024 GPT-4V(ision) Is a Human-Aligned Evaluator for Text-to-3D Generation Tong Wu, Guandao Yang, Zhibing Li, Kai Zhang, Ziwei Liu, Leonidas Guibas, Dahua Lin, Gordon Wetzstein

CVPR 2024 GPT4Point: A Unified Framework for Point-Language Understanding and Generation Zhangyang Qi, Ye Fang, Zeyi Sun, Xiaoyang Wu, Tong Wu, Jiaqi Wang, Dahua Lin, Hengshuang Zhao

ECCV 2024 GeoWizard: Unleashing the Diffusion Priors for 3D Geometry Estimation from a Single Image Xiao Fu, Wei Yin, Mu Hu, Kaixuan Wang, Yuexin Ma, Ping Tan, Shaojie Shen, Dahua Lin, Xiaoxiao Long

CVPR 2024 HumanGaussian: Text-Driven 3D Human Generation with Gaussian Splatting Xian Liu, Xiaohang Zhan, Jiaxiang Tang, Ying Shan, Gang Zeng, Dahua Lin, Xihui Liu, Ziwei Liu

NeurIPS 2024 HumanVid: Demystifying Training Data for Camera-Controllable Human Image Animation Zhenzhi Wang, Yixuan Li, Yanhong Zeng, Youqing Fang, Yuwei Guo, Wenran Liu, Jing Tan, Kai Chen, Tianfan Xue, Bo Dai, Dahua Lin

ICLR 2024 HyperHuman: Hyper-Realistic Human Generation with Latent Structural Diffusion Xian Liu, Jian Ren, Aliaksandr Siarohin, Ivan Skorokhodov, Yanyu Li, Dahua Lin, Xihui Liu, Ziwei Liu, Sergey Tulyakov

NeurIPS 2024 InterControl: Zero-Shot Human Interaction Generation by Controlling Every Joint Zhenzhi Wang, Jingbo Wang, Yixuan Li, Dahua Lin, Bo Dai

NeurIPS 2024 InternLM-XComposer2-4KHD: A Pioneering Large Vision-Language Model Handling Resolutions from 336 Pixels to 4k HD Xiaoyi Dong, Pan Zhang, Yuhang Zang, Yuhang Cao, Bin Wang, Linke Ouyang, Songyang Zhang, Haodong Duan, Wenwei Zhang, Yining Li, Hang Yan, Yang Gao, Zhe Chen, Xinyue Zhang, Wei Li, Jingwen Li, Wenhai Wang, Kai Chen, Conghui He, Xingcheng Zhang, Jifeng Dai, Yu Qiao, Dahua Lin, Jiaqi Wang

NeurIPS 2024 Lean Workbook: A Large-Scale Lean Problem Set Formalized from Natural Language Math Problems Huaiyuan Ying, Zijian Wu, Yihan Geng, Jiayu Wang, Dahua Lin, Kai Chen

CoRL 2024 Learning H-Infinity Locomotion Control Junfeng Long, Wenye Yu, Quanyi Li, ZiRui Wang, Dahua Lin, Jiangmiao Pang

ICML 2024 Linear Alignment: A Closed-Form Solution for Aligning Human Preferences Without Tuning and Feedback Songyang Gao, Qiming Ge, Wei Shen, Shihan Dou, Junjie Ye, Xiao Wang, Rui Zheng, Yicheng Zou, Zhi Chen, Hang Yan, Qi Zhang, Dahua Lin

NeurIPS 2024 MGF: Mixed Gaussian Flow for Diverse Trajectory Prediction Jiahe Chen, Jinkun Cao, Dahua Lin, Kris Kitani, Jiangmiao Pang

ECCV 2024 MMBENCH: Is Your Multi-Modal Model an All-Around Player? Yuan Liu, Haodong Duan, Yuanhan Zhang, Bo Li, Songyang Zhang, Wangbo Zhao, Yike Yuan, Jiaqi Wang, Conghui He, Ziwei Liu, Kai Chen, Dahua Lin

NeurIPS 2024 MMBench-Video: A Long-Form Multi-Shot Benchmark for Holistic Video Understanding Xinyu Fang, Kangrui Mao, Haodong Duan, Xiangyu Zhao, Yining Li, Dahua Lin, Kai Chen

NeurIPS 2024 MMDU: A Multi-Turn Multi-Image Dialog Understanding Benchmark and Instruction-Tuning Dataset for LVLMs Ziyu Liu, Tao Chu, Yuhang Zang, Xilin Wei, Xiaoyi Dong, Pan Zhang, Zijian Liang, Yuanjun Xiong, Yu Qiao, Dahua Lin, Jiaqi Wang

NeurIPS 2024 MMScan: A Multi-Modal 3D Scene Dataset with Hierarchical Grounded Language Annotations Ruiyuan Lyu, Jingli Lin, Tai Wang, Shuai Yang, Xiaohan Mao, Yilun Chen, Runsen Xu, Haifeng Huang, Chenming Zhu, Dahua Lin, Jiangmiao Pang

NeurIPS 2024 Make-It-Real: Unleashing Large Multimodal Model for Painting 3D Objects with Realistic Materials Ye Fang, Zeyi Sun, Tong Wu, Jiaqi Wang, Ziwei Liu, Gordon Wetzstein, Dahua Lin

ICML 2024 MuxServe: Flexible Spatial-Temporal Multiplexing for Multiple LLM Serving Jiangfei Duan, Runyu Lu, Haojie Duanmu, Xiuhong Li, Xingcheng Zhang, Dahua Lin, Ion Stoica, Hao Zhang

CVPR 2024 OPERA: Alleviating Hallucination in Multi-Modal Large Language Models via Over-Trust Penalty and Retrospection-Allocation Qidong Huang, Xiaoyi Dong, Pan Zhang, Bin Wang, Conghui He, Jiaqi Wang, Dahua Lin, Weiming Zhang, Nenghai Yu

NeurIPS 2024 OlympicArena: Benchmarking Multi-Discipline Cognitive Reasoning for Superintelligent AI Zhen Huang, Zengzhi Wang, Shijie Xia, Xuefeng Li, Haoyang Zou, Ruijie Xu, Run-Ze Fan, Lyumanshan Ye, Ethan Chern, Yixin Ye, Yikai Zhang, Yuqing Yang, Ting Wu, Binjie Wang, Shichao Sun, Yang Xiao, Yiyuan Li, Fan Zhou, Steffi Chern, Yiwei Qin, Yan Ma, Jiadi Su, Yixiu Liu, Yuxiang Zheng, Shaoting Zhang, Dahua Lin, Yu Qiao, Pengfei Liu

ECCV 2024 Omni6D: Large-Vocabulary 3D Object Dataset for Category-Level 6d Object Pose Estimation Mengchen Zhang, Tong Wu, Tai Wang, Tengfei Wang, Ziwei Liu, Dahua Lin

CVPR 2024 OneLLM: One Framework to Align All Modalities with Language Jiaming Han, Kaixiong Gong, Yiyuan Zhang, Jiaqi Wang, Kaipeng Zhang, Dahua Lin, Yu Qiao, Peng Gao, Xiangyu Yue

TMLR 2024 PixMIM: Rethinking Pixel Reconstruction in Masked Image Modeling Yuan Liu, Songyang Zhang, Jiacheng Chen, Kai Chen, Dahua Lin

ECCV 2024 PointLLM: Empowering Large Language Models to Understand Point Clouds Runsen Xu, Xiaolong Wang, Tai Wang, Yilun Chen, Jiangmiao Pang, Dahua Lin

NeurIPS 2024 Prism: A Framework for Decoupling and Assessing the Capabilities of VLMs Yuxuan Qiao, Haodong Duan, Xinyu Fang, Junming Yang, Lin Chen, Songyang Zhang, Jiaqi Wang, Dahua Lin, Kai Chen

ECCV 2024 Rethinking Image-to-Video Adaptation: An Object-Centric Perspective Rui Qian, Shuangrui Ding, Dahua Lin

ICLR 2024 SEINE: Short-to-Long Video Diffusion Model for Generative Transition and Prediction Xinyuan Chen, Yaohui Wang, Lingjun Zhang, Shaobin Zhuang, Xin Ma, Jiashuo Yu, Yali Wang, Dahua Lin, Yu Qiao, Ziwei Liu

CVPR 2024 Scaffold-GS: Structured 3D Gaussians for View-Adaptive Rendering Tao Lu, Mulin Yu, Linning Xu, Yuanbo Xiangli, Limin Wang, Dahua Lin, Bo Dai

ICLR 2024 Scaling Laws of RoPE-Based Extrapolation Xiaoran Liu, Hang Yan, Chenxin An, Xipeng Qiu, Dahua Lin

ICLRW 2024 Shadow Alignment: The Ease of Subverting Safely-Aligned Language Models Xianjun Yang, Xiao Wang, Qi Zhang, Linda Ruth Petzold, William Yang Wang, Xun Zhao, Dahua Lin

ECCV 2024 ShareGPT4V: Improving Large Multi-Modal Models with Better Captions Lin Chen, Jinsong Li, Xiaoyi Dong, Pan Zhang, Conghui He, Jiaqi Wang, Feng Zhao, Dahua Lin

NeurIPS 2024 ShareGPT4Video: Improving Video Understanding and Generation with Better Captions Lin Chen, Xilin Wei, Jinsong Li, Xiaoyi Dong, Pan Zhang, Yuhang Zang, Zehui Chen, Haodong Duan, Bin Lin, Zhenyu Tang, Li Yuan, Yu Qiao, Dahua Lin, Feng Zhao, Jiaqi Wang

ECCV 2024 SparseCtrl: Adding Sparse Controls to Text-to-Video Diffusion Models Yuwei Guo, Ceyuan Yang, Anyi Rao, Maneesh Agrawala, Dahua Lin, Bo Dai

NeurIPS 2024 Streaming Long Video Understanding with Large Language Models Rui Qian, Xiaoyi Dong, Pan Zhang, Yuhang Zang, Shuangrui Ding, Dahua Lin, Jiaqi Wang

CVPR 2024 Towards Text-Guided 3D Scene Composition Qihang Zhang, Chaoyang Wang, Aliaksandr Siarohin, Peiye Zhuang, Yinghao Xu, Ceyuan Yang, Dahua Lin, Bolei Zhou, Sergey Tulyakov, Hsin-Ying Lee

ICLR 2024 Unified Human-Scene Interaction via Prompted Chain-of-Contacts Zeqi Xiao, Tai Wang, Jingbo Wang, Jinkun Cao, Wenwei Zhang, Bo Dai, Dahua Lin, Jiangmiao Pang

CVPR 2024 VBench: Comprehensive Benchmark Suite for Video Generative Models Ziqi Huang, Yinan He, Jiashuo Yu, Fan Zhang, Chenyang Si, Yuming Jiang, Yuanhan Zhang, Tianxing Wu, Qingyang Jin, Nattapol Chanpaisit, Yaohui Wang, Xinyuan Chen, Limin Wang, Dahua Lin, Yu Qiao, Ziwei Liu

CoRL 2024 VLM-Grounder: A VLM Agent for Zero-Shot 3D Visual Grounding Runsen Xu, Zhiwei Huang, Tai Wang, Yilun Chen, Jiangmiao Pang, Dahua Lin

CVPR 2024 VideoBooth: Diffusion-Based Video Generation with Image Prompts Yuming Jiang, Tianxing Wu, Shuai Yang, Chenyang Si, Dahua Lin, Yu Qiao, Chen Change Loy, Ziwei Liu

ICCV 2023 AssetField: Assets Mining and Reconfiguration in Ground Feature Plane Representation Yuanbo Xiangli, Linning Xu, Xingang Pan, Nanxuan Zhao, Bo Dai, Dahua Lin

CVPRW 2023 Cali-NCE: Boosting Cross-Modal Video Representation Learning with Calibrated Alignment Nanxuan Zhao, Jianbo Jiao, Weidi Xie, Dahua Lin

CVPR 2023 Controllable Mesh Generation Through Sparse Latent Point Diffusion Models Zhaoyang Lyu, Jinyi Wang, Yuwei An, Ya Zhang, Dahua Lin, Bo Dai

ICCV 2023 DNA-Rendering: A Diverse Neural Actor Repository for High-Fidelity Human-Centric Rendering Wei Cheng, Ruixiang Chen, Siming Fan, Wanqi Yin, Keyu Chen, Zhongang Cai, Jingbo Wang, Yang Gao, Zhengming Yu, Zhengyu Lin, Daxuan Ren, Lei Yang, Ziwei Liu, Chen Change Loy, Chen Qian, Wayne Wu, Dahua Lin, Bo Dai, Kwan-Yee Lin

CoRL 2023 DORT: Modeling Dynamic Objects in Recurrent for Multi-Camera 3D Object Detection and Tracking Qing Lian, Tai Wang, Dahua Lin, Jiangmiao Pang

CVPR 2023 Grid-Guided Neural Radiance Fields for Large Urban Scenes Linning Xu, Yuanbo Xiangli, Sida Peng, Xingang Pan, Nanxuan Zhao, Christian Theobalt, Bo Dai, Dahua Lin

IJCAI 2023 HireVAE: An Online and Adaptive Factor Model Based on Hierarchical and Regime-Switch VAE Zikai Wei, Anyi Rao, Bo Dai, Dahua Lin

ICCV 2023 Improving Pixel-Based MIM by Reducing Wasted Modeling Capability Yuan Liu, Songyang Zhang, Jiacheng Chen, Zhaohui Yu, Kai Chen, Dahua Lin

ICCV 2023 Learning Human Dynamics in Autonomous Driving Scenarios Jingbo Wang, Ye Yuan, Zhengyi Luo, Kevin Xie, Dahua Lin, Umar Iqbal, Sanja Fidler, Sameh Khamis

CVPR 2023 MV-JAR: Masked Voxel Jigsaw and Reconstruction for LiDAR-Based Self-Supervised Pre-Training Runsen Xu, Tai Wang, Wenwei Zhang, Runjian Chen, Jinkun Cao, Jiangmiao Pang, Dahua Lin

ICCV 2023 MatrixCity: A Large-Scale City Dataset for City-Scale Neural Rendering and Beyond Yixuan Li, Lihan Jiang, Linning Xu, Yuanbo Xiangli, Zhenzhi Wang, Dahua Lin, Bo Dai

CVPR 2023 Multi-Level Logit Distillation Ying Jin, Jiaqi Wang, Dahua Lin

CVPR 2023 OmniCity: Omnipotent City Understanding with Multi-Level and Multi-View Images Weijia Li, Yawen Lai, Linning Xu, Yuanbo Xiangli, Jinhua Yu, Conghui He, Gui-Song Xia, Dahua Lin

CVPR 2023 OmniObject3D: Large-Vocabulary 3D Object Dataset for Realistic Perception, Reconstruction and Generation Tong Wu, Jiarui Zhang, Xiao Fu, Yuxin Wang, Jiawei Ren, Liang Pan, Wayne Wu, Lei Yang, Jiaqi Wang, Chen Qian, Dahua Lin, Ziwei Liu

CVPR 2023 RIFormer: Keep Your Vision Backbone Effective but Removing Token Mixer Jiahao Wang, Songyang Zhang, Yong Liu, Taiqiang Wu, Yujiu Yang, Xihui Liu, Kai Chen, Ping Luo, Dahua Lin

NeurIPS 2023 RenderMe-360: A Large Digital Asset Library and Benchmarks Towards High-Fidelity Head Avatars Dongwei Pan, Long Zhuo, Jingtan Piao, Huiwen Luo, Wei Cheng, Yuxin Wang, Siming Fan, Shengqi Liu, Lei Yang, Bo Dai, Ziwei Liu, Chen Change Loy, Chen Qian, Wayne Wu, Dahua Lin, Kwan-Yee Lin

ICCV 2023 Scene as Occupancy Wenwen Tong, Chonghao Sima, Tai Wang, Li Chen, Silei Wu, Hanming Deng, Yi Gu, Lewei Lu, Ping Luo, Dahua Lin, Hongyang Li

ICCV 2023 Semantics Meets Temporal Correspondence: Self-Supervised Object-Centric Learning in Videos Rui Qian, Shuangrui Ding, Xian Liu, Dahua Lin

ICCV 2023 SynBody: Synthetic Dataset with Layered Human Models for 3D Human Perception and Modeling Zhitao Yang, Zhongang Cai, Haiyi Mei, Shuai Liu, Zhaoxi Chen, Weiye Xiao, Yukun Wei, Zhongfei Qing, Chen Wei, Bo Dai, Wayne Wu, Chen Qian, Dahua Lin, Ziwei Liu, Lei Yang

ICCV 2023 V3Det: Vast Vocabulary Visual Detection Dataset Jiaqi Wang, Pan Zhang, Tao Chu, Yuhang Cao, Yujie Zhou, Tong Wu, Bin Wang, Conghui He, Dahua Lin

ICLR 2023 Voxurf: Voxel-Based Efficient and Accurate Neural Surface Reconstruction Tong Wu, Jiaqi Wang, Xingang Pan, Xudong Xu, Christian Theobalt, Ziwei Liu, Dahua Lin

ICLR 2022 A Conditional Point Diffusion-Refinement Paradigm for 3D Point Cloud Completion Zhaoyang Lyu, Zhifeng Kong, Xudong Xu, Liang Pan, Dahua Lin

NeurIPS 2022 Audio-Driven Co-Speech Gesture Video Generation Xian Liu, Qianyi Wu, Hang Zhou, Yuanqi Du, Wayne Wu, Dahua Lin, Ziwei Liu

ECCV 2022 BungeeNeRF: Progressive Neural Radiance Field for Extreme Multi-Scale Scene Rendering Yuanbo Xiangli, Linning Xu, Xingang Pan, Nanxuan Zhao, Anyi Rao, Christian Theobalt, Bo Dai, Dahua Lin

ECCVW 2022 Mitigating Representation Bias in Action Recognition: Algorithms and Benchmarks Haodong Duan, Yue Zhao, Kai Chen, Yuanjun Xiong, Dahua Lin

ECCV 2022 Monocular 3D Object Detection with Depth from Motion Tai Wang, Jiangmiao Pang, Dahua Lin

NeurIPSW 2022 Novel Policy Seeking with Constrained Optimization Hao Sun, Zhenghao Peng, Bo Dai, Dahua Lin, Bolei Zhou

CVPR 2022 OCSampler: Compressing Videos to One CLIP with Single-Step Sampling Jintao Lin, Haodong Duan, Kai Chen, Dahua Lin, Limin Wang

CVPR 2022 Revisiting Skeleton-Based Action Recognition Haodong Duan, Yue Zhao, Kai Chen, Dahua Lin, Bo Dai

NeurIPS 2022 Semi-Supervised Semantic Segmentation via Gentle Teaching Assistant Ying Jin, Jiaqi Wang, Dahua Lin

ECCV 2022 Static and Dynamic Concepts for Self-Supervised Video Representation Learning Rui Qian, Shuangrui Ding, Xian Liu, Dahua Lin

CVPR 2022 SwinTextSpotter: Scene Text Spotting via Better Synergy Between Text Detection and Text Recognition Mingxin Huang, Yuliang Liu, Zhenghao Peng, Chongyu Liu, Dahua Lin, Shenggao Zhu, Nicholas Yuan, Kai Ding, Lianwen Jin

CVPR 2022 Towards Diverse and Natural Scene-Aware 3D Human Motion Synthesis Jingbo Wang, Yu Rong, Jingyuan Liu, Sijie Yan, Dahua Lin, Bo Dai

CVPR 2022 TransRank: Self-Supervised Video Representation Learning via Ranking-Based Transformation Recognition Haodong Duan, Nanxuan Zhao, Kai Chen, Dahua Lin

AISTATS 2021 Understanding the Wiring Evolution in Differentiable Neural Architecture Search Sirui Xie, Shoukang Hu, Xinjiang Wang, Chunxiao Liu, Jianping Shi, Xunying Liu, Dahua Lin

ICCV 2021 3D Building Reconstruction from Monocular Remote Sensing Images Weijia Li, Lingxuan Meng, Jinwang Wang, Conghui He, Gui-Song Xia, Dahua Lin

CVPR 2021 Adversarial Robustness Under Long-Tailed Distribution Tong Wu, Ziwei Liu, Qingqiu Huang, Yu Wang, Dahua Lin

NeurIPS 2021 Balanced Chamfer Distance as a Comprehensive Metric for Point Cloud Completion Tong Wu, Liang Pan, Junzhe Zhang, Tai Wang, Ziwei Liu, Dahua Lin

ICCV 2021 BlockPlanner: City Block Generation with Vectorized Graph Representation Linning Xu, Yuanbo Xiangli, Anyi Rao, Nanxuan Zhao, Bo Dai, Ziwei Liu, Dahua Lin

CVPR 2021 Cylindrical and Asymmetrical 3D Convolution Networks for LiDAR Segmentation Xinge Zhu, Hui Zhou, Tai Wang, Fangzhou Hong, Yuexin Ma, Wei Li, Hongsheng Li, Dahua Lin

ICCVW 2021 FCOS3D: Fully Convolutional One-Stage Monocular 3D Object Detection Tai Wang, Xinge Zhu, Jiangmiao Pang, Dahua Lin

NeurIPS 2021 Few-Shot Object Detection via Association and DIscrimination Yuhang Cao, Jiaqi Wang, Ying Jin, Tong Wu, Kai Chen, Ziwei Liu, Dahua Lin

NeurIPS 2021 Generative Occupancy Fields for 3D Surface-Aware Image Synthesis Xudong Xu, Xingang Pan, Dahua Lin, Bo Dai

AAAI 2021 Joint Semantic-Geometric Learning for Polygonal Building Segmentation Weijia Li, Wenqian Zhao, Huaping Zhong, Conghui He, Dahua Lin

CoRL 2021 Probabilistic and Geometric Depth: Detecting Objects in Perspective Tai Wang, Xinge Zhu, Jiangmiao Pang, Dahua Lin

CVPR 2021 Scene-Aware Generative Network for Human Motion Synthesis Jingbo Wang, Sijie Yan, Bo Dai, Dahua Lin

CVPR 2021 Seesaw Loss for Long-Tailed Instance Segmentation Jiaqi Wang, Wenwei Zhang, Yuhang Zang, Yuhang Cao, Jiangmiao Pang, Tao Gong, Kai Chen, Ziwei Liu, Chen Change Loy, Dahua Lin

AAAI 2021 Temporal ROI Align for Video Object Recognition Tao Gong, Kai Chen, Xinjiang Wang, Qi Chu, Feng Zhu, Dahua Lin, Nenghai Yu, Huamin Feng

CVPR 2021 Towards Evaluating and Training Verifiably Robust Neural Networks Zhaoyang Lyu, Minghao Guo, Tong Wu, Guodong Xu, Kehuan Zhang, Dahua Lin

ICCV 2021 Vision Transformer with Progressive Sampling Xiaoyu Yue, Shuyang Sun, Zhanghui Kuang, Meng Wei, Philip H.S. Torr, Wayne Zhang, Dahua Lin

CVPR 2021 Visually Informed Binaural Audio Generation Without Binaural Audios Xudong Xu, Hang Zhou, Ziwei Liu, Bo Dai, Xiaogang Wang, Dahua Lin

ECCV 2020 A Unified Framework for Shot Type Classification Based on Subject Centric Lens Anyi Rao, Jiaze Wang, Linning Xu, Xuekun Jiang, Qingqiu Huang, Bolei Zhou, Dahua Lin

ECCV 2020 Caption-Supervised Face Recognition: Training a State-of-the-Art Face Model Without Manual Annotation Qingqiu Huang, Lei Yang, Huaiyi Huang, Tong Wu, Dahua Lin

ECCV 2020 Distribution-Balanced Loss for Multi-Label Classification in Long-Tailed Datasets Tong Wu, Qingqiu Huang, Ziwei Liu, Yu Wang, Dahua Lin

ECCV 2020 Exploiting Deep Generative Prior for Versatile Image Restoration and Manipulation Xingang Pan, Xiaohang Zhan, Bo Dai, Dahua Lin, Chen Change Loy, Ping Luo

AAAI 2020 Fastened CROWN: Tightened Neural Network Robustness Certificates Zhaoyang Lyu, Ching-Yun Ko, Zhifeng Kong, Ngai Wong, Dahua Lin, Luca Daniel

ECCV 2020 Learn to Propagate Reliably on Noisy Affinity Graphs Lei Yang, Qingqiu Huang, Huaiyi Huang, Linning Xu, Dahua Lin

CoRL 2020 Learning a Decision Module by Imitating Driver’s Control Behaviors Junning Huang, Sirui Xie, Jiankai Sun, Qiurui Ma, Chunxiao Liu, Dahua Lin, Bolei Zhou

ECCV 2020 Motion Guided 3D Pose Estimation from Videos Jingbo Wang, Sijie Yan, Yuanjun Xiong, Dahua Lin

ECCV 2020 MovieNet: A Holistic Dataset for Movie Understanding Qingqiu Huang, Yu Xiong, Anyi Rao, Jiaze Wang, Dahua Lin

ECCV 2020 Omni-Sourced Webly-Supervised Learning for Video Recognition Haodong Duan, Yue Zhao, Yuanjun Xiong, Wentao Liu, Dahua Lin

ECCV 2020 Online Multi-Modal Person Search in Videos Jiangyue Xia, Anyi Rao, Qingqiu Huang, Linning Xu, Jiangtao Wen, Dahua Lin

ECCV 2020 Placepedia: Comprehensive Place Understanding with Multi-Faceted Annotations Huaiyi Huang, Yuqi Zhang, Qingqiu Huang, Zhengkui Guo, Ziwei Liu, Dahua Lin

ICLR 2020 Real or Not Real, That Is the Question Yuanbo Xiangli, Yubin Deng, Bo Dai, Chen Change Loy, Dahua Lin

CoRL 2020 Reconfigurable Voxels: A New Representation for LiDAR-Based Point Clouds Tai Wang, Xinge Zhu, Dahua Lin

ECCV 2020 Sep-Stereo: Visually Guided Stereophonic Audio Generation by Associating Source Separation Hang Zhou, Xudong Xu, Dahua Lin, Xiaogang Wang, Ziwei Liu

ECCV 2020 Side-Aware Boundary Localization for More Precise Object Detection Jiaqi Wang, Wenwei Zhang, Yuhang Cao, Kai Chen, Jiangmiao Pang, Tao Gong, Jianping Shi, Chen Change Loy, Dahua Lin

ICML 2019 POPQORN: Quantifying Robustness of Recurrent Neural Networks Ching-Yun Ko, Zhaoyang Lyu, Lily Weng, Luca Daniel, Ngai Wong, Dahua Lin

NeurIPS 2019 Policy Continuation with Hindsight Inverse Dynamics Hao Sun, Zhizhong Li, Xiaotong Liu, Bolei Zhou, Dahua Lin

NeurIPS 2018 A Neural Compositional Paradigm for Image Captioning Bo Dai, Sanja Fidler, Dahua Lin

AAAI 2018 Accelerated Training for Massive Classification via Dynamic Class Selection Xingcheng Zhang, Lei Yang, Junjie Yan, Dahua Lin

ECCV 2018 Consensus-Driven Propagation in Massive Unlabeled Data for Face Recognition Xiaohang Zhan, Ziwei Liu, Junjie Yan, Dahua Lin, Chen Change Loy

ECCV 2018 Find and Focus: Retrieve and Localize Video Events with Natural Language Queries Dian Shao, Yu Xiong, Yue Zhao, Qingqiu Huang, Yu Qiao, Dahua Lin

ECCV 2018 Lifelong Learning via Progressive Distillation and Retrospection Saihui Hou, Xinyu Pan, Chen Change Loy, Zilei Wang, Dahua Lin

ECCV 2018 Move Forward and Tell: A Progressive Generator of Video Descriptions Yilei Xiong, Bo Dai, Dahua Lin

ECCV 2018 PSANet: Point-Wise Spatial Attention Network for Scene Parsing Hengshuang Zhao, Yi Zhang, Shu Liu, Jianping Shi, Chen Change Loy, Dahua Lin, Jiaya Jia

ECCV 2018 Penalizing Top Performers: Conservative Loss for Semantic Segmentation Adaptation Xinge Zhu, Hui Zhou, Ceyuan Yang, Jianping Shi, Dahua Lin

ECCV 2018 Person Search in Videos with One Portrait Through Visual and Temporal Links Qingqiu Huang, Wentao Liu, Dahua Lin

ECCV 2018 Pose Guided Human Video Generation Ceyuan Yang, Zhe Wang, Xinge Zhu, Chen Huang, Jianping Shi, Dahua Lin

AAAI 2018 Probabilistic Ensemble of Collaborative Filters Zhiyu Min, Dahua Lin

ECCV 2018 Rethinking the Form of Latent States in Image Captioning Bo Dai, Deming Ye, Dahua Lin

AAAI 2018 Spatial Temporal Graph Convolutional Networks for Skeleton-Based Action Recognition Sijie Yan, Yuanjun Xiong, Dahua Lin

NeurIPS 2018 Trajectory Convolution for Action Recognition Yue Zhao, Yuanjun Xiong, Dahua Lin

ICCV 2017 Be Your Own Prada: Fashion Synthesis with Structural Coherence Shizhan Zhu, Raquel Urtasun, Sanja Fidler, Dahua Lin, Chen Change Loy

NeurIPS 2017 Contrastive Learning for Image Captioning Bo Dai, Dahua Lin

CVPR 2017 Detecting Visual Relationships with Deep Relational Networks Bo Dai, Yuqi Zhang, Dahua Lin

CVPR 2017 Discover and Learn New Objects from Documentaries Kai Chen, Hang Song, Chen Change Loy, Dahua Lin

IJCAI 2017 Integrating Specialized Classifiers Based on Continuous Time Markov Chain Zhizhong Li, Dahua Lin

CVPR 2017 PolyNet: A Pursuit of Structural Diversity in Very Deep Networks Xingcheng Zhang, Zhizhong Li, Chen Change Loy, Dahua Lin

IJCAI 2017 Scalable Estimation of Dirichlet Process Mixture Models on Distributed Data Ruohui Wang, Dahua Lin

ICCV 2017 Temporal Action Detection with Structured Segment Networks Yue Zhao, Yuanjun Xiong, Limin Wang, Zhirong Wu, Xiaoou Tang, Dahua Lin

ICCV 2017 Towards Diverse and Natural Image Descriptions via a Conditional GAN Bo Dai, Sanja Fidler, Raquel Urtasun, Dahua Lin

CVPR 2017 UntrimmedNets for Weakly Supervised Action Recognition and Detection Limin Wang, Yuanjun Xiong, Dahua Lin, Luc Van Gool

ECCV 2016 Deep Markov Random Field for Image Modeling Zhirong Wu, Dahua Lin, Xiaoou Tang

ECCV 2016 Temporal Segment Networks: Towards Good Practices for Deep Action Recognition Limin Wang, Yuanjun Xiong, Zhe Wang, Yu Qiao, Dahua Lin, Xiaoou Tang, Luc Van Gool

CVPR 2015 Recognize Complex Events from Static Images by Fusing Deep Channels Yuanjun Xiong, Kai Zhu, Dahua Lin, Xiaoou Tang

CVPR 2014 Visual Semantic Search: Retrieving Videos via Complex Textual Queries Dahua Lin, Sanja Fidler, Chen Kong, Raquel Urtasun

CVPR 2014 What Are You Talking About? Text-to-Image Coreference Chen Kong, Dahua Lin, Mohit Bansal, Raquel Urtasun, Sanja Fidler

ICCV 2013 Characterizing Layouts of Outdoor Scenes Using Spatial Topic Processes Dahua Lin, Jianxiong Xiao

ICCV 2013 Hidden Factor Analysis for Age Invariant Face Recognition Dihong Gong, Zhifeng Li, Dahua Lin, Jianzhuang Liu, Xiaoou Tang

ICCV 2013 Holistic Scene Understanding for 3D Object Detection with RGBD Cameras Dahua Lin, Sanja Fidler, Raquel Urtasun

NeurIPS 2013 Online Learning of Nonparametric Mixture Models via Sequential Variational Approximation Dahua Lin

NeurIPS 2012 Coupling Nonparametric Mixtures via Latent Dirichlet Processes Dahua Lin, John W. Fisher

AISTATS 2012 Efficient Sampling from Combinatorial Space via Bridging Dahua Lin, John Fisher

ECCV 2012 Learning Deformations with Parallel Transport Donglai Wei, Dahua Lin, John W. Fisher Iii

CVPR 2012 Low Level Vision via Switchable Markov Random Fields Dahua Lin, John W. Fisher Iii

CVPR 2012 Manifold Guided Composite of Markov Random Fields for Image Modeling Dahua Lin, John W. Fisher Iii

NeurIPS 2010 Construction of Dependent Dirichlet Processes Based on Poisson Processes Dahua Lin, Eric Grimson, John W. Fisher

ECCV 2010 Joint People, Event, and Location Recognition in Personal Photo Collections Using Cross-Domain Context Dahua Lin, Ashish Kapoor, Gang Hua, Simon Baker

CVPR 2010 Modeling and Estimating Persistent Motion with Geometric Flows Dahua Lin, Eric Grimson, John W. Fisher Iii

CVPR 2009 Learning Visual Flows: A Lie Algebraic Approach Dahua Lin, W. Eric L. Grimson, John W. Fisher Iii

CVPR 2007 Discriminant Mutual Subspace Learning for Indoor and Outdoor Face Recognition Zhifeng Li, Dahua Lin, Helen M. Meng, Xiaoou Tang

CVPR 2007 Quality-Driven Face Occlusion Detection and Recovery Dahua Lin, Xiaoou Tang

ECCV 2006 Conditional Infomax Learning: An Integrated Framework for Feature Extraction and Fusion Dahua Lin, Xiaoou Tang

ECCV 2006 Inter-Modality Face Recognition Dahua Lin, Xiaoou Tang

CVPR 2006 Pursuing Informative Projection on Grassmann Manifold Dahua Lin, Shuicheng Yan, Xiaoou Tang

CVPR 2006 Recognize High Resolution Faces: From Macrocosm to Microcosm Dahua Lin, Xiaoou Tang

ICCV 2005 Coupled Space Learning for Image Style Transformation Dahua Lin, Xiaoou Tang

CVPR 2005 Hallucinating Faces: TensorPatch Super-Resolution and Coupled Residue Compensation Wei Liu, Dahua Lin, Xiaoou Tang

CVPR 2005 Nonparametric Subspace Analysis for Face Recognition Zhifeng Li, Wei Liu, Dahua Lin, Xiaoou Tang