Sheng, Lu

35 publications

CVPR 2025 Code-as-Monitor: Constraint-Aware Visual Programming for Reactive and Proactive Robotic Failure Detection Enshen Zhou, Qi Su, Cheng Chi, Zhizheng Zhang, Zhongyuan Wang, Tiejun Huang, Lu Sheng, He Wang

CVPR 2025 MIDI: Multi-Instance Diffusion for Single Image to 3D Scene Generation Zehuan Huang, Yuan-Chen Guo, Xingqiao An, Yunhan Yang, Yangguang Li, Zi-Xin Zou, Ding Liang, Xihui Liu, Yan-Pei Cao, Lu Sheng

ICCV 2025 MV-Adapter: Multi-View Consistent Image Generation Made Easy Zehuan Huang, Yuan-Chen Guo, Haoran Wang, Ran Yi, Lizhuang Ma, Yan-Pei Cao, Lu Sheng

CVPR 2025 Ouroboros3D: Image-to-3D Generation via 3D-Aware Recursive Diffusion Hao Wen, Zehuan Huang, Yaohui Wang, Xinyuan Chen, Lu Sheng

NeurIPS 2025 RoboRefer: Towards Spatial Referring with Reasoning in Vision-Language Models for Robotics Enshen Zhou, Jingkun An, Cheng Chi, Yi Han, Shanyu Rong, Chi Zhang, Pengwei Wang, Zhongyuan Wang, Tiejun Huang, Lu Sheng, Shanghang Zhang

NeurIPS 2025 Systematic Reward Gap Optimization for Mitigating VLM Hallucinations Lehan He, Zeren Chen, Zhelun Shi, Tianyu Yu, Jing Shao, Lu Sheng

CVPR 2025 T2ISafety: Benchmark for Assessing Fairness, Toxicity, and Privacy in Image Generation Lijun Li, Zhelun Shi, Xuhao Hu, Bowen Dong, Yiran Qin, Xihui Liu, Lu Sheng, Jing Shao

ICML 2025 WorldSimBench: Towards Video Generation Models as World Simulators Yiran Qin, Zhelun Shi, Jiwen Yu, Xijun Wang, Enshen Zhou, Lijun Li, Zhenfei Yin, Xihui Liu, Lu Sheng, Jing Shao, Lei Bai, Ruimao Zhang

NeurIPSW 2024 Chain-of-Imagination for Reliable Instruction Following in Decision Making Enshen Zhou, Yiran Qin, Zhenfei Yin, Yuzhou Huang, Ruimao Zhang, Lu Sheng, Yu Qiao, Jing Shao

AAAI 2024 Data-Free Generalized Zero-Shot Learning Bowen Tang, Jing Zhang, Long Yan, Qian Yu, Lu Sheng, Dong Xu

CVPR 2024 EpiDiff: Enhancing Multi-View Synthesis via Localized Epipolar-Constrained Diffusion Zehuan Huang, Hao Wen, Junting Dong, Yaohui Wang, Yangguang Li, Xinyuan Chen, Yan-Pei Cao, Ding Liang, Yu Qiao, Bo Dai, Lu Sheng

CVPR 2024 MP5: A Multi-Modal Open-Ended Embodied System in Minecraft via Active Perception Yiran Qin, Enshen Zhou, Qichang Liu, Zhenfei Yin, Lu Sheng, Ruimao Zhang, Yu Qiao, Jing Shao

AAAI 2024 Multi-Modality Affinity Inference for Weakly Supervised 3D Semantic Segmentation Xiawei Li, Qingyuan Xu, Jing Zhang, Tianyi Zhang, Qian Yu, Lu Sheng, Dong Xu

ICLR 2024 Octavius: Mitigating Task Interference in MLLMs via LoRA-MoE Zeren Chen, Ziqin Wang, Zhen Wang, Huayang Liu, Zhenfei Yin, Si Liu, Lu Sheng, Wanli Ouyang, Jing Shao

NeurIPSW 2024 RH20T-P: A Primitive-Level Robotic Manipulation Dataset Towards Composable Generalization Agents in Real-World Scenarios Zeren Chen, Zhelun Shi, Xiaoya Lu, Lehan He, Sucheng Qian, Zhenfei Yin, Wanli Ouyang, Jing Shao, Yu Qiao, Cewu Lu, Lu Sheng

IJCAI 2024 Self-Supervised Monocular Depth Estimation in the Dark: Towards Data Distribution Compensation Haolin Yang, Chaoqiang Zhao, Lu Sheng, Yang Tang

NeurIPS 2023 LAMM: Language-Assisted Multi-Modal Instruction-Tuning Dataset, Framework, and Benchmark Zhenfei Yin, Jiong Wang, Jianjian Cao, Zhelun Shi, Dingning Liu, Mukai Li, Xiaoshui Huang, Zhiyong Wang, Lu Sheng, Lei Bai, Jing Shao, Wanli Ouyang

CVPR 2023 Siamese DETR Zeren Chen, Gengshi Huang, Wei Li, Jianing Teng, Kun Wang, Jing Shao, Chen Change Loy, Lu Sheng

CVPR 2023 VL-SAT: Visual-Linguistic Semantics Assisted Training for 3D Semantic Scene Graph Prediction in Point Cloud Ziqin Wang, Bowen Cheng, Lichen Zhao, Dong Xu, Yang Tang, Lu Sheng

CVPR 2022 3DJCG: A Unified Framework for Joint Dense Captioning and Visual Grounding on 3D Point Clouds Daigang Cai, Lichen Zhao, Jing Zhang, Lu Sheng, Dong Xu

AAAI 2022 DanceFormer: Music Conditioned 3D Dance Generation with Parametric Motion Transformer Buyu Li, Yongchi Zhao, Zhelun Shi, Lu Sheng

ECCV 2022 Improving RGB-D Point Cloud Registration by Learning Multi-Scale Local Linear Transformation Ziming Wang, Xiaoliang Huo, Zhenghao Chen, Jing Zhang, Lu Sheng, Dong Xu

ECCV 2022 SketchSampler: Sketch-Based 3D Reconstruction via View-Dependent Depth Sampling Chenjian Gao, Qian Yu, Lu Sheng, Yi-Zhe Song, Dong Xu

ECCV 2022 X-Learner: Learning Cross Sources and Tasks for Universal Visual Representation Yinan He, Gengshi Huang, Siyu Chen, Jianing Teng, Kun Wang, Zhenfei Yin, Lu Sheng, Ziwei Liu, Yu Qiao, Jing Shao

ICCV 2021 3DVG-Transformer: Relation Modeling for Visual Grounding on Point Clouds Lichen Zhao, Daigang Cai, Lu Sheng, Dong Xu

CVPR 2021 Back-Tracing Representative Points for Voting-Based 3D Object Detection in Point Clouds Bowen Cheng, Lu Sheng, Shaoshuai Shi, Ming Yang, Dong Xu

CVPR 2021 ForgeryNet: A Versatile Benchmark for Comprehensive Forgery Analysis Yinan He, Bei Gan, Siyu Chen, Yichun Zhou, Guojun Yin, Luchuan Song, Lu Sheng, Jing Shao, Ziwei Liu

WACV 2021 IncreACO: Incrementally Learned Automatic Check-Out with Photorealistic Exemplar Augmentation Yandan Yang, Lu Sheng, Xiaolong Jiang, Haochen Wang, Dong Xu, Xianbin Cao

ICCV 2021 StyleFormer: Real-Time Arbitrary Style Transfer via Parametric Style Composition Xiaolei Wu, Zhihao Hu, Lu Sheng, Dong Xu

AAAI 2020 Morphing and Sampling Network for Dense Point Cloud Completion Minghua Liu, Lu Sheng, Sheng Yang, Jing Shao, Shi-Min Hu

ECCV 2020 Powering One-Shot Topological NAS with Stabilized Share-Parameter Proxy Ronghao Guo, Chen Lin, Chuming Li, Keyu Tian, Ming Sun, Lu Sheng, Junjie Yan

ECCV 2020 Thinking in Frequency: Face Forgery Detection by Mining Frequency-Aware Clues Yuyang Qian, Guojun Yin, Lu Sheng, Zixuan Chen, Jing Shao

ECCV 2018 Zoom-Net: Mining Deep Feature Interactions for Visual Relationship Recognition Guojun Yin, Lu Sheng, Bin Liu, Nenghai Yu, Xiaogang Wang, Jing Shao, Chen Change Loy

CVPR 2017 A Generative Model for Depth-Based Robust 3D Facial Pose Tracking Lu Sheng, Jianfei Cai, Tat-Jen Cham, Vladimir Pavlovic, King Ngi Ngan

ICCV 2017 HydraPlus-Net: Attentive Deep Features for Pedestrian Analysis Xihui Liu, Haiyu Zhao, Maoqing Tian, Lu Sheng, Jing Shao, Shuai Yi, Junjie Yan, Xiaogang Wang