Lin, Kevin

43 publications

CVPR 2025 BizGen: Advancing Article-Level Visual Text Rendering for Infographics Generation Yuyang Peng, Shishi Xiao, Keming Wu, Qisheng Liao, Bohan Chen, Kevin Lin, Danqing Huang, Ji Li, Yuhui Yuan

CoRL 2025 Constraint-Preserving Data Generation for One-Shot Visuomotor Policy Generalization Kevin Lin, Varun Ragunath, Andrew McAlinden, Aaditya Prasad, Jimmy Wu, Yuke Zhu, Jeannette Bohg

ICLR 2025 EditRoom: LLM-Parameterized Graph Diffusion for Composable 3D Room Layout Editing Kaizhi Zheng, Xiaotong Chen, Xuehai He, Jing Gu, Linjie Li, Zhengyuan Yang, Kevin Lin, Jianfeng Wang, Lijuan Wang, Xin Eric Wang

ICLR 2025 GenXD: Generating Any 3D and 4D Scenes Yuyang Zhao, Chung-Ching Lin, Kevin Lin, Zhiwen Yan, Linjie Li, Zhengyuan Yang, Jianfeng Wang, Gim Hee Lee, Lijuan Wang

ICCV 2025 ImageGen-CoT: Enhancing Text-to-Image In-Context Learning with Chain-of-Thought Reasoning Jiaqi Liao, Zhengyuan Yang, Linjie Li, Dianqi Li, Kevin Lin, Yu Cheng, Lijuan Wang

CVPR 2025 LiVOS: Light Video Object Segmentation with Gated Linear Matching Qin Liu, Jianfeng Wang, Zhengyuan Yang, Linjie Li, Kevin Lin, Marc Niethammer, Lijuan Wang

ICLR 2025 MMWorld: Towards Multi-Discipline Multi-Faceted World Model Evaluation in Videos Xuehai He, Weixi Feng, Kaizhi Zheng, Yujie Lu, Wanrong Zhu, Jiachen Li, Yue Fan, Jianfeng Wang, Linjie Li, Zhengyuan Yang, Kevin Lin, William Yang Wang, Lijuan Wang, Xin Eric Wang

NeurIPS 2025 Point-RFT: Improving Multimodal Reasoning with Visually Grounded Reinforcement Finetuning Minheng Ni, Zhengyuan Yang, Linjie Li, Chung-Ching Lin, Kevin Lin, Wangmeng Zuo, Lijuan Wang

ICCV 2025 Scaling Inference-Time Search with Vision Value Model for Improved Visual Comprehension Xiyao Wang, Zhengyuan Yang, Linjie Li, Hongjin Lu, Yuancheng Xu, Chung-Ching Lin, Kevin Lin, Furong Huang, Lijuan Wang

ICLRW 2025 Scaling Inference-Time Search with Vision Value Model for Improved Visual Comprehension Xiyao Wang, Zhengyuan Yang, Linjie Li, Hongjin Lu, Yuancheng Xu, Chung-Ching Lin, Kevin Lin, Furong Huang, Lijuan Wang

ICLR 2025 SlowFast-VGen: Slow-Fast Learning for Action-Driven Long Video Generation Yining Hong, Beide Liu, Maxine Wu, Yuanhao Zhai, Kai-Wei Chang, Linjie Li, Kevin Lin, Chung-Ching Lin, Jianfeng Wang, Zhengyuan Yang, Ying Nian Wu, Lijuan Wang

NeurIPS 2025 SoTA with Less: MCTS-Guided Sample Selection for Data-Efficient Visual Reasoning Self-Improvement Xiyao Wang, Zhengyuan Yang, Chao Feng, Hongjin Lu, Linjie Li, Chung-Ching Lin, Kevin Lin, Furong Huang, Lijuan Wang

ICLR 2025 Tuning Timestep-Distilled Diffusion Model Using Pairwise Sample Optimization Zichen Miao, Zhengyuan Yang, Kevin Lin, Ze Wang, Zicheng Liu, Lijuan Wang, Qiang Qiu

NeurIPS 2025 ViCrit: A Verifiable Reinforcement Learning Proxy Task for Visual Perception in VLMs Xiyao Wang, Zhengyuan Yang, Chao Feng, Yuhang Zhou, Xiaoyu Liu, Yongyuan Liang, Ming Li, Ziyi Zang, Linjie Li, Chung-Ching Lin, Kevin Lin, Furong Huang, Lijuan Wang

CVPR 2024 DisCo: Disentangled Control for Realistic Human Dance Generation Tan Wang, Linjie Li, Kevin Lin, Yuanhao Zhai, Chung-Ching Lin, Zhengyuan Yang, Hanwang Zhang, Zicheng Liu, Lijuan Wang

ECCV 2024 IDOL: Unified Dual-Modal Latent Diffusion for Human-Centric Joint Video-Depth Generation Yuanhao Zhai, Kevin Lin, Linjie Li, Chung-Ching Lin, Jianfeng Wang, Zhengyuan Yang, David Doermann, Junsong Yuan, Zicheng Liu, Lijuan Wang

ECCV 2024 Idea2Img: Iterative Self-Refinement with GPT-4V for Automatic Image Design and Generation Zhengyuan Yang, Jianfeng Wang, Linjie Li, Kevin Lin, Chung-Ching Lin, Zicheng Liu, Lijuan Wang

CVPR 2024 MM-Narrator: Narrating Long-Form Videos with Multimodal In-Context Learning Chaoyi Zhang, Kevin Lin, Zhengyuan Yang, Jianfeng Wang, Linjie Li, Chung-Ching Lin, Zicheng Liu, Lijuan Wang

ICML 2024 MM-Vet: Evaluating Large Multimodal Models for Integrated Capabilities Weihao Yu, Zhengyuan Yang, Linjie Li, Jianfeng Wang, Kevin Lin, Zicheng Liu, Xinchao Wang, Lijuan Wang

NeurIPSW 2024 MMWorld: Towards Multi-Discipline Multi-Faceted World Model Evaluation in Videos Xuehai He, Weixi Feng, Kaizhi Zheng, Yujie Lu, Wanrong Zhu, Jiachen Li, Yue Fan, Jianfeng Wang, Linjie Li, Zhengyuan Yang, Kevin Lin, William Yang Wang, Lijuan Wang, Xin Eric Wang

WACV 2024 MPT: Mesh Pre-Training with Transformers for Human Pose and Mesh Reconstruction Kevin Lin, Chung-Ching Lin, Lin Liang, Zicheng Liu, Lijuan Wang

NeurIPS 2024 Meta-Diffu$B$: A Contextualized Sequence-to-Sequence Text Diffusion Model with Meta-Exploration Yun-Yen Chuang, Hung-Min Hsu, Kevin Lin, Chen-Sheng Gu, Ling Zhen Li, Ray-I Chang, Hung-yi Lee

ICLR 2024 Mitigating Hallucination in Large Multi-Modal Models via Robust Instruction Tuning Fuxiao Liu, Kevin Lin, Linjie Li, Jianfeng Wang, Yaser Yacoob, Lijuan Wang

NeurIPS 2024 Motion Consistency Model: Accelerating Video Diffusion with Disentangled Motion-Appearance Distillation Yuanhao Zhai, Kevin Lin, Zhengyuan Yang, Linjie Li, Jianfeng Wang, Chung-Ching Lin, David Doermann, Junsong Yuan, Lijuan Wang

CVPR 2023 Adaptive Human Matting for Dynamic Videos Chung-Ching Lin, Jiang Wang, Kun Luo, Kevin Lin, Linjie Li, Lijuan Wang, Zicheng Liu

CVPR 2023 An Empirical Study of End-to-End Video-Language Transformers with Masked Visual Modeling Tsu-Jui Fu, Linjie Li, Zhe Gan, Kevin Lin, William Yang Wang, Lijuan Wang, Zicheng Liu

ICCV 2023 Equivariant Similarity for Vision-Language Foundation Models Tan Wang, Kevin Lin, Linjie Li, Chung-Ching Lin, Zhengyuan Yang, Hanwang Zhang, Zicheng Liu, Lijuan Wang

CVPR 2023 LAVENDER: Unifying Video-Language Understanding as Masked Language Modeling Linjie Li, Zhe Gan, Kevin Lin, Chung-Ching Lin, Zicheng Liu, Ce Liu, Lijuan Wang

CVPR 2023 Neural Voting Field for Camera-Space 3D Hand Pose Estimation Lin Huang, Chung-Ching Lin, Kevin Lin, Lin Liang, Lijuan Wang, Junsong Yuan, Zicheng Liu

CVPR 2023 ReCo: Region-Controlled Text-to-Image Generation Zhengyuan Yang, Jianfeng Wang, Zhe Gan, Linjie Li, Kevin Lin, Chenfei Wu, Nan Duan, Zicheng Liu, Ce Liu, Michael Zeng, Lijuan Wang

CVPR 2022 Cross-Modal Representation Learning for Zero-Shot Action Recognition Chung-Ching Lin, Kevin Lin, Lijuan Wang, Zicheng Liu, Linjie Li

TMLR 2022 GIT: A Generative Image-to-Text Transformer for Vision and Language Jianfeng Wang, Zhengyuan Yang, Xiaowei Hu, Linjie Li, Kevin Lin, Zhe Gan, Zicheng Liu, Ce Liu, Lijuan Wang

AAAI 2022 OVIS: Open-Vocabulary Visual Instance Search via Visual-Semantic Aligned Representation Learning Sheng Liu, Kevin Lin, Lijuan Wang, Junsong Yuan, Zicheng Liu

CVPR 2022 SwinBERT: End-to-End Transformers with Sparse Attention for Video Captioning Kevin Lin, Linjie Li, Chung-Ching Lin, Faisal Ahmed, Zhe Gan, Zicheng Liu, Yumao Lu, Lijuan Wang

CVPR 2021 End-to-End Human Pose and Mesh Reconstruction with Transformers Kevin Lin, Lijuan Wang, Zicheng Liu

ICCV 2021 Mesh Graphormer Kevin Lin, Lijuan Wang, Zicheng Liu

AAAI 2021 VIVO: Visual Vocabulary Pre-Training for Novel Object Captioning Xiaowei Hu, Xi Yin, Kevin Lin, Lei Zhang, Jianfeng Gao, Lijuan Wang, Zicheng Liu

ICLR 2020 Neural Module Networks for Reasoning over Text Nitish Gupta, Kevin Lin, Dan Roth, Sameer Singh, Matt Gardner

ICML 2020 Train Big, Then Compress: Rethinking Model Size for Efficient Training and Inference of Transformers Zhuohan Li, Eric Wallace, Sheng Shen, Kevin Lin, Kurt Keutzer, Dan Klein, Joey Gonzalez

NeurIPS 2017 A Sharp Error Analysis for the Fused Lasso, with Application to Approximate Changepoint Screening Kevin Lin, James L Sharpnack, Alessandro Rinaldo, Ryan J Tibshirani

NeurIPS 2017 Adversarial Ranking for Language Generation Kevin Lin, Dianqi Li, Xiaodong He, Zhengyou Zhang, Ming-ting Sun

CVPR 2016 Learning Compact Binary Descriptors with Unsupervised Deep Neural Networks Kevin Lin, Jiwen Lu, Chu-Song Chen, Jie Zhou

CVPRW 2015 Deep Learning of Binary Hash Codes for Fast Image Retrieval Kevin Lin, Huei-Fang Yang, Jen-Hao Hsiao, Chu-Song Chen