Niebles, Juan Carlos

83 publications

TMLR 2026 SMILE: A Composite Lexical-Semantic Metric for Question-Answering Evaluation Shrikant Kendre, Austin Xu, Honglu Zhou, Michael S Ryoo, Shafiq Joty, Juan Carlos Niebles

NeurIPS 2025 APIGen-MT: Agentic Pipeline for Multi-Turn Data Generation via Simulated Agent-Human Interplay Akshara Prabhakar, Zuxin Liu, Ming Zhu, Jianguo Zhang, Tulika Manoj Awalgaonkar, Shiyu Wang, Zhiwei Liu, Haolin Chen, Thai Quoc Hoang, Juan Carlos Niebles, Shelby Heinecke, Weiran Yao, Huan Wang, Silvio Savarese, Caiming Xiong

CVPRW 2025 AdaVid: Adaptive Video-Language Pretraining Chaitanya Patel, Juan Carlos Niebles, Ehsan Adeli

NeurIPS 2025 Exploring Diffusion Transformer Designs via Grafting Keshigeyan Chandrasegaran, Michael Poli, Daniel Y Fu, Dongjun Kim, Lea M. Hadzic, Manling Li, Agrim Gupta, Stefano Massaroli, Azalia Mirhoseini, Juan Carlos Niebles, Stefano Ermon, Li Fei-Fei

CVPR 2025 Re-Thinking Temporal Search for Long-Form Video Understanding Jinhui Ye, Zihan Wang, Haosen Sun, Keshigeyan Chandrasegaran, Zane Durante, Cristobal Eyzaguirre, Yonatan Bisk, Juan Carlos Niebles, Ehsan Adeli, Li Fei-Fei, Jiajun Wu, Manling Li

ICLRW 2025 TACO: Learning Multi-Modal Models to Reason and Act with Synthetic Chains-of-Thought-and-Action Zixian Ma, Jianguo Zhang, Zhiwei Liu, Jieyu Zhang, Juntao Tan, Manli Shu, Juan Carlos Niebles, Shelby Heinecke, Huan Wang, Caiming Xiong, Ranjay Krishna, Silvio Savarese

NeurIPS 2025 Taming Generative Video Models for Zero-Shot Optical Flow Extraction Seungwoo Kim, Khai Loong Aw, Klemen Kotar, Cristobal Eyzaguirre, Wanhee Lee, Yunong Liu, Jared Watrous, Stefan Stojanov, Juan Carlos Niebles, Jiajun Wu, Daniel LK Yamins

ICLRW 2025 ToolScan: A Benchmark for Characterizing Errors in Tool-Use LLMs Shirley Kokane, Ming Zhu, Tulika Manoj Awalgaonkar, Jianguo Zhang, Akshara Prabhakar, Thai Quoc Hoang, Zuxin Liu, R N Rithesh, Liangwei Yang, Weiran Yao, Juntao Tan, Zhiwei Liu, Huan Wang, Juan Carlos Niebles, Shelby Heinecke, Caiming Xiong, Silvio Savarese

ICML 2025 Understanding Complexity in VideoQA via Visual Program Generation Cristobal Eyzaguirre, Igor Vasiljevic, Achal Dave, Jiajun Wu, Rares Andrei Ambrus, Thomas Kollar, Juan Carlos Niebles, Pavel Tokmakov

ICCV 2025 UniEgoMotion: A Unified Model for Egocentric Motion Reconstruction, Forecasting, and Generation Chaitanya Patel, Hiroki Nakamura, Yuta Kyuragi, Kazuki Kozuka, Juan Carlos Niebles, Ehsan Adeli

ICML 2025 Unifying Specialized Visual Encoders for Video Language Models Jihoon Chung, Tyler Zhu, Max Gonzalez Saez-Diez, Juan Carlos Niebles, Honglu Zhou, Olga Russakovsky

ICLRW 2025 VLM Q-Learning: Aligning Vision-Language Models for Interactive Decision-Making Jake Grigsby, Yuke Zhu, Michael S Ryoo, Juan Carlos Niebles

CVPR 2025 ViUniT: Visual Unit Tests for More Robust Visual Programming Artemis Panagopoulou, Honglu Zhou, Silvio Savarese, Caiming Xiong, Chris Callison-Burch, Mark Yatskar, Juan Carlos Niebles

ICML 2025 Why Is Spatial Reasoning Hard for VLMs? an Attention Mechanism Perspective on Focus Areas Shiqi Chen, Tongyao Zhu, Ruochen Zhou, Jinghan Zhang, Siyang Gao, Juan Carlos Niebles, Mor Geva, Junxian He, Jiajun Wu, Manling Li

NeurIPS 2024 APIGen: Automated PIpeline for Generating Verifiable and Diverse Function-Calling Datasets Zuxin Liu, Thai Hoang, Jianguo Zhang, Ming Zhu, Tian Lan, Shirley Kokane, Juntao Tan, Weiran Yao, Zhiwei Liu, Yihao Feng, Rithesh Murthy, Liangwei Yang, Silvio Savarese, Juan Carlos Niebles, Huan Wang, Shelby Heinecke, Caiming Xiong

ICLRW 2024 Bolaa: Benchmarking and Orchestrating LLM Autonomous Agents Zhiwei Liu, Weiran Yao, Jianguo Zhang, Le Xue, Shelby Heinecke, R N Rithesh, Yihao Feng, Zeyuan Chen, Juan Carlos Niebles, Devansh Arpit, Ran Xu, Phil L Mui, Huan Wang, Caiming Xiong, Silvio Savarese

CLeaR 2024 Causal Layering via Conditional Entropy Itai Feigenbaum, Devansh Arpit, Shelby Heinecke, Juan Carlos Niebles, Weiran Yao, Caiming Xiong, Silvio Savarese, Huan Wang

NeurIPS 2024 IKEA Manuals at Work: 4D Grounding of Assembly Instructions on Internet Videos Yunong Liu, Cristobal Eyzaguirre, Manling Li, Shubh Khanna, Juan Carlos Niebles, Vineeth Ravi, Saumitra Mishra, Weiyu Liu, Jiajun Wu

ECCV 2024 LayoutDETR: Detection Transformer Is a Good Multimodal Layout Designer Ning Yu, Chia-chih Chen, Zeyuan Chen, Rui Meng, Gang Wu, Paul W Josel, Juan Carlos Niebles, Caiming Xiong, Ran Xu

PGM 2024 On the Unlikelihood of D-Separation Itai Feigenbaum, Devansh Arpit, Shelby Heinecke, Juan Carlos Niebles, Weiran Yao, Huan Wang, Caiming Xiong, Silvio Savarese

ICLRW 2024 REX: Rapid Exploration and eXploitation for AI Agents R N Rithesh, Shelby Heinecke, Juan Carlos Niebles, Zhiwei Liu, Le Xue, Weiran Yao, Yihao Feng, Zeyuan Chen, Akash Gokul, Devansh Arpit, Ran Xu, Phil L Mui, Huan Wang, Caiming Xiong, Silvio Savarese

ICLR 2024 Retroformer: Retrospective Large Language Agents with Policy Gradient Optimization Weiran Yao, Shelby Heinecke, Juan Carlos Niebles, Zhiwei Liu, Yihao Feng, Le Xue, R N Rithesh, Zeyuan Chen, Jianguo Zhang, Devansh Arpit, Ran Xu, Phil L Mui, Huan Wang, Caiming Xiong, Silvio Savarese

NeurIPS 2024 Streaming Detection of Queried Event Start Cristóbal Eyzaguirre, Eric Tang, Shyamal Buch, Adrien Gaidon, Jiajun Wu, Juan Carlos Niebles

ICLRW 2024 The Agent Ohana: Designing Unified Data and Training Pipeline for Effective Agent Learning Jianguo Zhang, Tian Lan, R N Rithesh, Zhiwei Liu, Weiran Yao, Juntao Tan, Thai Quoc Hoang, Liangwei Yang, Yihao Feng, Zuxin Liu, Ming Zhu, Tulika Manoj Awalgaonkar, Juan Carlos Niebles, Silvio Savarese, Shelby Heinecke, Huan Wang, Caiming Xiong

CVPR 2024 ULIP-2: Towards Scalable Multimodal Pre-Training for 3D Understanding Le Xue, Ning Yu, Shu Zhang, Artemis Panagopoulou, Junnan Li, Roberto Martín-Martín, Jiajun Wu, Caiming Xiong, Ran Xu, Juan Carlos Niebles, Silvio Savarese

ECCV 2024 X-InstructBLIP: A Framework for Aligning Image, 3D, Audio, Video to LLMs and Its Emergent Cross-Modal Reasoning Artemis Panagopoulou, Le Xue, Ning Yu, Li Junnan, Dongxu Li, Shafiq Joty, Ran Xu, Silvio Savarese, Caiming Xiong, Juan Carlos Niebles

ECCVW 2024 xGen-VideoSyn-1: High-Fidelity Text-to-Video Synthesis with Compressed Representations Can Qin, Congying Xia, Krithika Ramakrishnan, Michael S. Ryoo, Lifu Tu, Yihao Feng, Manli Shu, Honglu Zhou, Anas Awadalla, Jun Wang, Senthil Purushwalkam, Le Xue, Yingbo Zhou, Huan Wang, Silvio Savarese, Juan Carlos Niebles, Zeyuan Chen, Ran Xu, Caiming Xiong

ICCV 2023 Deformer: Dynamic Fusion Transformer for Robust Hand Pose Estimation Qichen Fu, Xingyu Liu, Ran Xu, Juan Carlos Niebles, Kris M. Kitani

CVPR 2023 Mask-Free OVIS: Open-Vocabulary Instance Segmentation Without Manual Mask Annotations Vibashan Vs, Ning Yu, Chen Xing, Can Qin, Mingfei Gao, Juan Carlos Niebles, Vishal M. Patel, Ran Xu

WACV 2023 PreViTS: Contrastive Pretraining with Video Tracking Supervision Brian Chen, Ramprasaath R. Selvaraju, Shih-Fu Chang, Juan Carlos Niebles, Nikhil Naik

CVPR 2023 Procedure-Aware Pretraining for Instructional Video Understanding Honglu Zhou, Roberto Martín-Martín, Mubbasir Kapadia, Silvio Savarese, Juan Carlos Niebles

NeurIPS 2023 Temporally Disentangled Representation Learning Under Unknown Nonstationarity Xiangchen Song, Weiran Yao, Yewen Fan, Xinshuai Dong, Guangyi Chen, Juan Carlos Niebles, Eric P. Xing, Kun Zhang

CVPR 2023 ULIP: Learning a Unified Representation of Language, Images, and Point Clouds for 3D Understanding Le Xue, Mingfei Gao, Chen Xing, Roberto Martín-Martín, Jiajun Wu, Caiming Xiong, Ran Xu, Juan Carlos Niebles, Silvio Savarese

NeurIPS 2023 UniControl: A Unified Diffusion Model for Controllable Visual Generation in the Wild Can Qin, Shu Zhang, Ning Yu, Yihao Feng, Xinyi Yang, Yingbo Zhou, Huan Wang, Juan Carlos Niebles, Caiming Xiong, Silvio Savarese, Stefano Ermon, Yun Fu, Ran Xu

CVPR 2022 Align and Prompt: Video-and-Language Pre-Training with Entity Prompts Dongxu Li, Junnan Li, Hongdong Li, Juan Carlos Niebles, Steven C.H. Hoi

ECCVW 2022 Identifying Auxiliary or Adversarial Tasks Using Necessary Condition Analysis for Adversarial Multi-Task Video Understanding Stephen Su, Samuel Kwong, Qingyu Zhao, De-An Huang, Juan Carlos Niebles, Ehsan Adeli

NeurIPS 2022 MOMA-LRG: Language-Refined Graphs for Multi-Object Multi-Actor Activity Parsing Zelun Luo, Zane Durante, Linden Li, Wanze Xie, Ruochen Liu, Emily Jin, Zhuoyi Huang, Lun Yu Li, Jiajun Wu, Juan Carlos Niebles, Ehsan Adeli, Fei-Fei Li

ECCV 2022 Open Vocabulary Object Detection with Pseudo Bounding-Box Labels Mingfei Gao, Chen Xing, Juan Carlos Niebles, Junnan Li, Ran Xu, Wenhao Liu, Caiming Xiong

ECCV 2022 PrivHAR: Recognizing Human Actions from Privacy-Preserving Lens Carlos Hinojosa, Miguel Marquez, Henry Arguello, Ehsan Adeli, Li Fei-Fei, Juan Carlos Niebles

CVPR 2022 Revisiting the "Video" in Video-Language Understanding Shyamal Buch, Cristóbal Eyzaguirre, Adrien Gaidon, Jiajun Wu, Li Fei-Fei, Juan Carlos Niebles

CVPRW 2021 CoCon: Cooperative-Contrastive Learning Nishant Rai, Ehsan Adeli, Kuan-Hui Lee, Adrien Gaidon, Juan Carlos Niebles

ICCV 2021 Detecting Human-Object Relationships in Videos Jingwei Ji, Rishi Desai, Juan Carlos Niebles

CVPR 2021 Home Action Genome: Cooperative Compositional Action Understanding Nishant Rai, Haofeng Chen, Jingwei Ji, Rishi Desai, Kazuki Kozuka, Shun Ishizaka, Ehsan Adeli, Juan Carlos Niebles

ICCV 2021 Learning Privacy-Preserving Optics for Human Pose Estimation Carlos Hinojosa, Juan Carlos Niebles, Henry Arguello

NeurIPS 2021 MOMA: Multi-Object Multi-Actor Activity Parsing Zelun Luo, Wanze Xie, Siddharth Kapoor, Yiyun Liang, Michael Cooper, Juan Carlos Niebles, Ehsan Adeli, Fei-Fei Li

CVPR 2021 Metadata Normalization Mandy Lu, Qingyu Zhao, Jiequan Zhang, Kilian M. Pohl, Li Fei-Fei, Juan Carlos Niebles, Ehsan Adeli

WACV 2021 Representation Learning with Statistical Independence to Mitigate Bias Ehsan Adeli, Qingyu Zhao, Adolf Pfefferbaum, Edith V. Sullivan, Li Fei-Fei, Juan Carlos Niebles, Kilian M. Pohl

ICCV 2021 TRiPOD: Human Trajectory and Pose Dynamics Forecasting in the Wild Vida Adeli, Mahsa Ehsanpour, Ian Reid, Juan Carlos Niebles, Silvio Savarese, Ehsan Adeli, Hamid Rezatofighi

AAAI 2020 Adversarial Cross-Domain Action Recognition with Co-Attention Boxiao Pan, Zhangjie Cao, Ehsan Adeli, Juan Carlos Niebles

WACV 2020 Disentangling Human Dynamics for Pedestrian Locomotion Forecasting with Noisy Supervision Karttikeya Mangalam, Ehsan Adeli, Kuan-Hui Lee, Adrien Gaidon, Juan Carlos Niebles

ECCV 2020 Procedure Planning in Instructional Videos Chien-Yi Chang, De-An Huang, Danfei Xu, Ehsan Adeli, Li Fei-Fei, Juan Carlos Niebles

ECCV 2020 RubiksNet: Learnable 3D-Shift for Efficient Video Action Recognition Linxi Fan, Shyamal Buch, Guanzhi Wang, Ryan Cao, Yuke Zhu, Juan Carlos Niebles, Li Fei-Fei

WACV 2019 Action-Agnostic Human Pose Forecasting Hsu-Kuang Chiu, Ehsan Adeli, Borui Wang, De-An Huang, Juan Carlos Niebles

WACV 2019 Interpretable Visual Question Answering by Visual Grounding from Attention Supervision Mining Yundong Zhang, Juan Carlos Niebles, Alvaro Soto

CVPRW 2019 Peeking into the Future: Predicting Future Person Activities and Locations in Videos Junwei Liang, Lu Jiang, Juan Carlos Niebles, Alexander G. Hauptmann, Li Fei-Fei

ECCV 2018 End-to-End Joint Semantic Segmentation of Actors and Actions in Video Jingwei Ji, Shyamal Buch, Alvaro Soto, Juan Carlos Niebles

ECCV 2018 Graph Distillation for Action Detection with Privileged Modalities Zelun Luo, Jun-Ting Hsieh, Lu Jiang, Juan Carlos Niebles, Li Fei-Fei

NeurIPS 2018 Learning to Decompose and Disentangle Representations for Video Prediction Jun-Ting Hsieh, Bingbin Liu, De-An Huang, Li F Fei-Fei, Juan Carlos Niebles

ECCV 2018 Liquid Pouring Monitoring via Rich Sensory Inputs Tz-Ying Wu, Juan-Ting Lin, Tsun-Hsuang Wang, Chan-Wei Hu, Juan Carlos Niebles, Min Sun

ECCV 2018 Temporal Modular Networks for Retrieving Complex Compositional Activities in Videos Bingbin Liu, Serena Yeung, Edward Chou, De-An Huang, Li Fei-Fei, Juan Carlos Niebles

CVPR 2017 Agent-Centric Risk Assessment: Accident Anticipation and Risky Region Localization Kuo-Hao Zeng, Shih-Han Chou, Fu-Hsiang Chan, Juan Carlos Niebles, Min Sun

ICCV 2017 Dense-Captioning Events in Videos Ranjay Krishna, Kenji Hata, Frederic Ren, Li Fei-Fei, Juan Carlos Niebles

AAAI 2017 Leveraging Video Descriptions to Learn Video Question Answering Kuo-Hao Zeng, Tseng-Hung Chen, Ching-Yao Chuang, Yuan-Hong Liao, Juan Carlos Niebles, Min Sun

ICCVW 2017 Risky Region Localization with Point Supervision Kazuki Kozuka, Juan Carlos Niebles

CVPR 2017 SST: Single-Stream Temporal Action Proposals Shyamal Buch, Victor Escorcia, Chuanqi Shen, Bernard Ghanem, Juan Carlos Niebles

CVPR 2017 Unsupervised Visual-Linguistic Reference Resolution in Instructional Videos De-An Huang, Joseph J. Lim, Li Fei-Fei, Juan Carlos Niebles

ICCV 2017 Visual Forecasting by Imitating Dynamics in Natural Sequences Kuo-Hao Zeng, William B. Shen, De-An Huang, Min Sun, Juan Carlos Niebles

CVPR 2016 A Hierarchical Pose-Based Approach to Complex Action Understanding Using Dictionaries of Actionlets and Motion Poselets Ivan Lillo, Juan Carlos Niebles, Alvaro Soto

ECCV 2016 Connectionist Temporal Modeling for Weakly Supervised Action Labeling De-An Huang, Li Fei-Fei, Juan Carlos Niebles

ECCV 2016 DAPs: Deep Action Proposals for Action Understanding Victor Escorcia, Fabian Caba Heilbron, Juan Carlos Niebles, Bernard Ghanem

CVPR 2016 Fast Temporal Activity Proposals for Efficient Detection of Human Actions in Untrimmed Videos Fabian Caba Heilbron, Juan Carlos Niebles, Bernard Ghanem

ECCV 2016 Title Generation for User Generated Videos Kuo-Hao Zeng, Tseng-Hung Chen, Juan Carlos Niebles, Min Sun

CVPR 2015 ActivityNet: A Large-Scale Video Benchmark for Human Activity Understanding Fabian Caba Heilbron, Victor Escorcia, Bernard Ghanem, Juan Carlos Niebles

CVPR 2015 On the Relationship Between Visual Attributes and Convolutional Networks Victor Escorcia, Juan Carlos Niebles, Bernard Ghanem

CVPR 2015 Robust Manhattan Frame Estimation from a Single RGB-D Image Bernard Ghanem, Ali Thabet, Juan Carlos Niebles, Fabian Caba Heilbron

CVPR 2014 Discriminative Hierarchical Modeling of Spatio-Temporally Composable Human Activities Ivan Lillo, Alvaro Soto, Juan Carlos Niebles

ICCVW 2013 Spatio-Temporal Human-Object Interactions for Action Recognition in Videos Victor Escorcia, Juan Carlos Niebles

CVPR 2010 Efficient Extraction of Human Motion Volumes by Tracking Juan Carlos Niebles, Bohyung Han, Li Fei-Fei

ECCV 2010 Modeling Temporal Structure of Decomposable Motion Segments for Activity Classification Juan Carlos Niebles, Chih-Wei Chen, Li Fei-Fei

CVPRW 2009 Mining Discriminative Adjectives and Prepositions for Natural Scene Recognition Bangpeng Yao, Juan Carlos Niebles, Li Fei-Fei

ECCV 2008 Extracting Moving People from Internet Videos Juan Carlos Niebles, Bohyung Han, Andras Ferencz, Li Fei-Fei

CVPR 2007 A Hierarchical Model of Shape and Appearance for Human Action Classification Juan Carlos Niebles, Li Fei-Fei

AAAI 2007 OPTIMOL: A Framework for Online Picture Collection via Incremental Model Learning Li-Jia Li, Juan Carlos Niebles, Li Fei-Fei