Ross, David A.

25 publications

CVPR 2025 Language-Guided Image Tokenization for Generation Kaiwen Zha, Lijun Yu, Alireza Fathi, David A. Ross, Cordelia Schmid, Dina Katabi, Xiuye Gu

ICLR 2024 Language Model Beats Diffusion - Tokenizer Is Key to Visual Generation Lijun Yu, Jose Lezama, Nitesh Bharadwaj Gundavarapu, Luca Versari, Kihyuk Sohn, David Minnen, Yong Cheng, Agrim Gupta, Xiuye Gu, Alexander G Hauptmann, Boqing Gong, Ming-Hsuan Yang, Irfan Essa, David A Ross, Lu Jiang

ICML 2024 SceneCraft: An LLM Agent for Synthesizing 3D Scenes as Blender Code Ziniu Hu, Ahmet Iscen, Aashi Jain, Thomas Kipf, Yisong Yue, David A Ross, Cordelia Schmid, Alireza Fathi

ICML 2024 VideoPoet: A Large Language Model for Zero-Shot Video Generation Dan Kondratyuk, Lijun Yu, Xiuye Gu, Jose Lezama, Jonathan Huang, Grant Schindler, Rachel Hornung, Vighnesh Birodkar, Jimmy Yan, Ming-Chang Chiu, Krishna Somandepalli, Hassan Akbari, Yair Alon, Yong Cheng, Joshua V. Dillon, Agrim Gupta, Meera Hahn, Anja Hauth, David Hendon, Alonso Martinez, David Minnen, Mikhail Sirotenko, Kihyuk Sohn, Xuan Yang, Hartwig Adam, Ming-Hsuan Yang, Irfan Essa, Huisheng Wang, David A Ross, Bryan Seybold, Lu Jiang

ICML 2024 VideoPrism: A Foundational Visual Encoder for Video Understanding Long Zhao, Nitesh Bharadwaj Gundavarapu, Liangzhe Yuan, Hao Zhou, Shen Yan, Jennifer J. Sun, Luke Friedman, Rui Qian, Tobias Weyand, Yue Zhao, Rachel Hornung, Florian Schroff, Ming-Hsuan Yang, David A Ross, Huisheng Wang, Hartwig Adam, Mikhail Sirotenko, Ting Liu, Boqing Gong

NeurIPS 2023 AVIS: Autonomous Visual Information Seeking with Large Language Model Agent Ziniu Hu, Ahmet Iscen, Chen Sun, Kai-Wei Chang, Yizhou Sun, David A. Ross, Cordelia Schmid, Alireza Fathi

NeurIPS 2023 DaTaSeg: Taming a Universal Multi-Dataset Multi-Task Segmentation Model Xiuye Gu, Yin Cui, Jonathan Huang, Abdullah Rashwan, Xuan Yang, Xingyi Zhou, Golnaz Ghiasi, Weicheng Kuo, Huizhong Chen, Liang-Chieh Chen, David A. Ross

CVPR 2023 REVEAL: Retrieval-Augmented Visual-Language Pre-Training with Multi-Source Multimodal Knowledge Memory Ziniu Hu, Ahmet Iscen, Chen Sun, Zirui Wang, Kai-Wei Chang, Yizhou Sun, Cordelia Schmid, David A. Ross, Alireza Fathi

NeurIPS 2023 SPAE: Semantic Pyramid AutoEncoder for Multimodal Generation with Frozen LLMs Lijun Yu, Yong Cheng, Zhiruo Wang, Vivek Kumar, Wolfgang Macherey, Yanping Huang, David A. Ross, Irfan A. Essa, Yonatan Bisk, Ming-Hsuan Yang, Kevin P. Murphy, Alexander Hauptmann, Lu Jiang

CVPRW 2022 What's in a Caption? Dataset-Specific Linguistic Diversity and Its Effect on Visual Description Models and Metrics David M. Chan, Austin Myers, Sudheendra Vijayanarasimhan, David A. Ross, Bryan Seybold, John F. Canny

ICCV 2021 AI Choreographer: Music Conditioned 3D Dance Generation with AIST++ Ruilong Li, Shan Yang, David A. Ross, Angjoo Kanazawa

ECCV 2020 An LSTM Approach to Temporal 3D Object Detection in LiDAR Point Clouds Rui Huang, Wanyue Zhang, Abhijit Kundu, Caroline Pantofaru, David A Ross, Thomas Funkhouser, Alireza Fathi

ECCV 2020 Pillar-Based Object Detection for Autonomous Driving Yue Wang, Alireza Fathi, Abhijit Kundu, David A. Ross, Caroline Pantofaru, Tom Funkhouser, Justin Solomon

MLJ 2013 On Using Nearly-Independent Feature Families for High Precision and Confidence Omid Madani, Manfred Georg, David A. Ross

ACML 2012 On Using Nearly-Independent Feature Families for High Precision and Confidence Omid Madani, Manfred Georg, David A. Ross

ICCV 2011 The Power of Comparative Reasoning Jay Yagnik, Dennis Strelow, David A. Ross, Ruei-Sung Lin

CVPR 2010 SPEC Hashing: Similarity Preserving Algorithm for Entropy-Based Coding Ruei-Sung Lin, David A. Ross, Jay Yagnik

CVPR 2008 Learning Stick-Figure Models Using Nonparametric Bayesian Priors over Trees Edward Meeds, David A. Ross, Richard S. Zemel, Sam T. Roweis

ECCV 2008 Unsupervised Learning of Skeletons from Motion David A. Ross, Daniel Tarlow, Richard S. Zemel

ICML 2006 Combining Discriminative Features to Infer Complex Trajectories David A. Ross, Simon Osindero, Richard S. Zemel

JMLR 2006 Learning Parts-Based Representations of Data David A. Ross, Richard S. Zemel

NeurIPS 2004 Adaptive Discriminative Generative Model and Its Applications Ruei-sung Lin, David A. Ross, Jongwoo Lim, Ming-Hsuan Yang

ECCV 2004 Adaptive Probabilistic Visual Tracking with Incremental Subspace Update David A. Ross, Jongwoo Lim, Ming-Hsuan Yang

NeurIPS 2004 Incremental Learning for Visual Tracking Jongwoo Lim, David A. Ross, Ruei-sung Lin, Ming-Hsuan Yang

NeurIPS 2002 Multiple Cause Vector Quantization David A. Ross, Richard S. Zemel