Chang, Shih-Fu

119 publications

AAAI 2024 Beyond Grounding: Extracting Fine-Grained Event Hierarchies Across Modalities Hammad A. Ayyubi, Christopher Thomas, Lovish Chum, Rahul Lokesh, Long Chen, Yulei Niu, Xudong Lin, Xuande Feng, Jaywon Koo, Sounak Ray, Shih-Fu Chang

ICLR 2024 Ferret: Refer and Ground Anything Anywhere at Any Granularity Haoxuan You, Haotian Zhang, Zhe Gan, Xianzhi Du, Bowen Zhang, Zirui Wang, Liangliang Cao, Shih-Fu Chang, Yinfei Yang

NeurIPS 2024 JourneyBench: A Challenging One-Stop Vision-Language Understanding Benchmark of Generated Images Zhecan Wang, Junzhang Liu, Chia-Wei Tang, Hani Alomari, Anushka Sivakumar, Rui Sun, Wenhao Li, Md. Atabuzzaman, Hammad Ayyubi, Haoxuan You, Alvi Ishmam, Kai-Wei Chang, Shih-Fu Chang, Chris Thomas

CVPR 2024 MoDE: CLIP Data Experts via Clustering Jiawei Ma, Po-Yao Huang, Saining Xie, Shang-Wen Li, Luke Zettlemoyer, Shih-Fu Chang, Wen-Tau Yih, Hu Xu

ECCV 2024 RAP: Retrieval-Augmented Planner for Adaptive Procedure Planning in Instructional Videos Ali Zare, Yulei Niu, Hammad Ayyubi, Shih-Fu Chang

ICLR 2024 SCHEMA: State CHangEs MAtter for Procedure Planning in Instructional Videos Yulei Niu, Wenliang Guo, Long Chen, Xudong Lin, Shih-Fu Chang

CVPR 2024 What When and Where? Self-Supervised Spatio-Temporal Grounding in Untrimmed Multi-Action Videos from Narrated Instructions Brian Chen, Nina Shvetsova, Andrew Rouditchenko, Daniel Kondermann, Samuel Thomas, Shih-Fu Chang, Rogerio Feris, James Glass, Hilde Kuehne

CVPR 2023 DiGeo: Discriminative Geometry-Aware Learning for Generalized Few-Shot Object Detection Jiawei Ma, Yulei Niu, Jincheng Xu, Shiyuan Huang, Guangxing Han, Shih-Fu Chang

CVPRW 2023 In Defense of Structural Symbolic Representation for Video Event-Relation Prediction Andrew Lu, Xudong Lin, Yulei Niu, Shih-Fu Chang

CVPRW 2023 Language Models Are Causal Knowledge Extractors for Zero-Shot Video Question Answering Hung-Ting Su, Yulei Niu, Xudong Lin, Winston H. Hsu, Shih-Fu Chang

WACV 2023 PreViTS: Contrastive Pretraining with Video Tracking Supervision Brian Chen, Ramprasaath R. Selvaraju, Shih-Fu Chang, Juan Carlos Niebles, Nikhil Naik

CVPR 2023 Supervised Masked Knowledge Distillation for Few-Shot Transformers Han Lin, Guangxing Han, Jiawei Ma, Shiyuan Huang, Xudong Lin, Shih-Fu Chang

ICLR 2023 TempCLR: Temporal Alignment Representation with Contrastive Learning Yuncong Yang, Jiawei Ma, Shiyuan Huang, Long Chen, Xudong Lin, Guangxing Han, Shih-Fu Chang

CVPR 2023 Towards Fast Adaptation of Pretrained Contrastive Models for Multi-Channel Video-Language Retrieval Xudong Lin, Simran Tiwari, Shiyuan Huang, Manling Li, Mike Zheng Shou, Heng Ji, Shih-Fu Chang

AAAI 2023 Video Event Extraction via Tracking Visual States of Arguments Guang Yang, Manling Li, Jiajie Zhang, Xudong Lin, Heng Ji, Shih-Fu Chang

CVPR 2022 CLIP-Event: Connecting Text and Images with Event Structures Manling Li, Ruochen Xu, Shuohang Wang, Luowei Zhou, Xudong Lin, Chenguang Zhu, Michael Zeng, Heng Ji, Shih-Fu Chang

ECCV 2022 Few-Shot End-to-End Object Detection via Constantly Concentrated Encoding Across Heads Jiawei Ma, Guangxing Han, Shiyuan Huang, Yuncong Yang, Shih-Fu Chang

CVPR 2022 Few-Shot Object Detection with Fully Cross-Transformer Guangxing Han, Jiawei Ma, Shiyuan Huang, Long Chen, Shih-Fu Chang

ECCV 2022 Fine-Grained Visual Entailment Christopher Thomas, Yipeng Zhang, Shih-Fu Chang

NeurIPS 2022 Language Models with Image Descriptors Are Strong Few-Shot Video-Language Learners Zhenhailong Wang, Manling Li, Ruochen Xu, Luowei Zhou, Jie Lei, Xudong Lin, Shuohang Wang, Ziyi Yang, Chenguang Zhu, Derek Hoiem, Shih-Fu Chang, Mohit Bansal, Heng Ji

ECCV 2022 Learning Visual Representation from Modality-Shared Contrastive Language-Image Pre-Training Haoxuan You, Luowei Zhou, Bin Xiao, Noel Codella, Yu Cheng, Ruochen Xu, Shih-Fu Chang, Lu Yuan

CVPR 2022 Learning to Recognize Procedural Activities with Distant Supervision Xudong Lin, Fabio Petroni, Gedas Bertasius, Marcus Rohrbach, Shih-Fu Chang, Lorenzo Torresani

AAAI 2022 Meta Faster R-CNN: Towards Accurate Few-Shot Object Detection with Attentive Feature Alignment Guangxing Han, Shiyuan Huang, Jiawei Ma, Yicheng He, Shih-Fu Chang

AAAI 2022 MuMuQA: Multimedia Multi-Hop News Question Answering via Cross-Media Knowledge Extraction and Grounding Revanth Gangi Reddy, Xilin Rui, Manling Li, Xudong Lin, Haoyang Wen, Jaemin Cho, Lifu Huang, Mohit Bansal, Avirup Sil, Shih-Fu Chang, Alexander G. Schwing, Heng Ji

CVPRW 2022 One-Stage Object Referring with Gaze Estimation Jianhang Chen, Xu Zhang, Yue Wu, Shalini Ghosh, Pradeep Natarajan, Shih-Fu Chang, Jan P. Allebach

AAAI 2022 SGEITL: Scene Graph Enhanced Image-Text Learning for Visual Commonsense Reasoning Zhecan Wang, Haoxuan You, Liunian Harold Li, Alireza Zareian, Suji Park, Yiqing Liang, Kai-Wei Chang, Shih-Fu Chang

CVPR 2022 Task-Adaptive Negative Envision for Few-Shot Open-Set Recognition Shiyuan Huang, Jiawei Ma, Guangxing Han, Shih-Fu Chang

ECCVW 2022 Video in 10 Bits: Few-Bit VideoQA for Efficiency and Privacy Shiyuan Huang, Robinson Piramuthu, Shih-Fu Chang, Gunnar A. Sigurdsson

CVPR 2021 Co-Grounding Networks with Semantic Attention for Referring Expression Comprehension in Videos Sijie Song, Xudong Lin, Jiaying Liu, Zongming Guo, Shih-Fu Chang

ICCV 2021 Multimodal Clustering Networks for Self-Supervised Learning from Unlabeled Videos Brian Chen, Andrew Rouditchenko, Kevin Duarte, Hilde Kuehne, Samuel Thomas, Angie Boggust, Rameswar Panda, Brian Kingsbury, Rogerio Feris, David Harwath, James Glass, Michael Picheny, Shih-Fu Chang

CVPR 2021 Open-Vocabulary Object Detection Using Captions Alireza Zareian, Kevin Dela Rosa, Derek Hao Hu, Shih-Fu Chang

ICCV 2021 Partner-Assisted Learning for Few-Shot Image Classification Jiawei Ma, Hanchen Xie, Guangxing Han, Shih-Fu Chang, Aram Galstyan, Wael Abd-Almageed

ICCV 2021 Query Adaptive Few-Shot Object Detection with Heterogeneous Graph Convolutional Networks Guangxing Han, Yicheng He, Shiyuan Huang, Jiawei Ma, Shih-Fu Chang

AAAI 2021 Ref-NMS: Breaking Proposal Bottlenecks in Two-Stage Referring Expression Grounding Long Chen, Wenbo Ma, Jun Xiao, Hanwang Zhang, Shih-Fu Chang

IJCAI 2021 Uncertainty-Aware Few-Shot Image Classification Zhizheng Zhang, Cuiling Lan, Wenjun Zeng, Zhibo Chen, Shih-Fu Chang

NeurIPS 2021 VATT: Transformers for Multimodal Self-Supervised Learning from Raw Video, Audio and Text Hassan Akbari, Liangzhe Yuan, Rui Qian, Wei-Hong Chuang, Shih-Fu Chang, Yin Cui, Boqing Gong

CVPR 2021 Vx2Text: End-to-End Learning of Video-Based Text Generation from Multimodal Inputs Xudong Lin, Gedas Bertasius, Jue Wang, Shih-Fu Chang, Devi Parikh, Lorenzo Torresani

ECCV 2020 Bridging Knowledge Graphs to Generate Scene Graphs Alireza Zareian, Svebor Karaman, Shih-Fu Chang

ECCV 2020 Context-Gated Convolution Xudong Lin, Lin Ma, Wei Liu, Shih-Fu Chang

ICLR 2020 Cross-Dimensional Self-Attention for Multivariate, Geo-Tagged Time Series Imputation Jiawei Ma, Zheng Shou, Alireza Zareian, Hassan Mansour, Anthony Vetro, Shih-Fu Chang

AAAI 2020 General Partial Label Learning via Dual Bipartite Graph Autoencoder Brian Chen, Bo Wu, Alireza Zareian, Hanwang Zhang, Shih-Fu Chang

ECCV 2020 Learning Visual Commonsense for Robust Scene Graph Generation Alireza Zareian, Zhecan Wang, Haoxuan You, Shih-Fu Chang

ECCV 2020 Learning to Learn Words from Visual Scenes Dídac Surís, Dave Epstein, Heng Ji, Shih-Fu Chang, Carl Vondrick

CVPRW 2019 Urban Semantic 3D Reconstruction from Multiview Satellite Imagery Matthew J. Leotta, Chengjiang Long, Bastien Jacquet, Matthieu Zins, Dan Lipsa, Jie Shan, Bo Xu, Zhixin Li, Xu Zhang, Shih-Fu Chang, Matthew Purri, Jia Xue, Kristin J. Dana

ECCV 2018 AutoLoc: Weakly-Supervised Temporal Action Localization in Untrimmed Videos Zheng Shou, Hang Gao, Lei Zhang, Kazuyuki Miyazawa, Shih-Fu Chang

NeurIPS 2018 Low-Shot Learning via Covariance-Preserving Adversarial Augmentation Networks Hang Gao, Zheng Shou, Alireza Zareian, Hanwang Zhang, Shih-Fu Chang

ECCV 2018 Online Detection of Action Start in Untrimmed, Streaming Videos Zheng Shou, Junting Pan, Jonathan Chan, Kazuyuki Miyazawa, Hassan Mansour, Anthony Vetro, Xavier Giro-i-Nieto, Shih-Fu Chang

ICLR 2018 Skip RNN: Learning to Skip State Updates in Recurrent Neural Networks Víctor Campos, Brendan Jou, Xavier Giró-i-Nieto, Jordi Torres, Shih-Fu Chang

CVPR 2017 CDC: Convolutional-De-Convolutional Networks for Precise Temporal Action Localization in Untrimmed Videos Zheng Shou, Jonathan Chan, Alireza Zareian, Kazuyuki Miyazawa, Shih-Fu Chang

WACV 2017 Deep Image Set Hashing Jie Feng, Svebor Karaman, Shih-Fu Chang

CVPR 2017 Learning Discriminative and Transformation Covariant Local Feature Detectors Xu Zhang, Felix X. Yu, Svebor Karaman, Shih-Fu Chang

ICCV 2017 Learning Spread-Out Local Feature Descriptors Xu Zhang, Felix X. Yu, Sanjiv Kumar, Shih-Fu Chang

ICCV 2017 PPR-FCN: Weakly Supervised Visual Relation Detection via Parallel Pairwise R-FCN Hanwang Zhang, Zawlin Kyaw, Jinyang Yu, Shih-Fu Chang

CVPR 2017 Visual Translation Embedding Network for Visual Relation Detection Hanwang Zhang, Zawlin Kyaw, Shih-Fu Chang, Tat-Seng Chua

WACV 2016 3D Shape Retrieval Using a Single Depth Image from Low-Cost Sensors Jie Feng, Yan Wang, Shih-Fu Chang

CVPR 2016 Interactive Segmentation on RGBD Images via Cue Selection Jie Feng, Brian Price, Scott Cohen, Shih-Fu Chang

CVPR 2016 Temporal Action Localization in Untrimmed Videos via Multi-Stage CNNs Zheng Shou, Dongang Wang, Shih-Fu Chang

CVPR 2015 Attributes and Categories for Generic Instance Search from One Example Ran Tao, Arnold W.M. Smeulders, Shih-Fu Chang

AAAI 2015 Low-Rank Similarity Metric Learning in High Dimensions Wei Liu, Cun Mu, Rongrong Ji, Shiqian Ma, John R. Smith, Shih-Fu Chang

CVPR 2015 New Insights into Laplacian Similarity Search Xiao-Ming Wu, Zhenguo Li, Shih-Fu Chang

ICML 2014 Circulant Binary Embedding Felix Yu, Sanjiv Kumar, Yunchao Gong, Shih-Fu Chang

NeurIPS 2014 Discrete Graph Hashing Wei Liu, Cun Mu, Sanjiv Kumar, Shih-Fu Chang

ECCV 2014 Discriminative Indexing for Probabilistic Image Patch Priors Yan Wang, Sunghyun Cho, Jue Wang, Shih-Fu Chang

ECCV 2014 From Low-Cost Depth Sensors to CAD: Cross-Domain 3D Shape Retrieval via Regression Tree Fields Yan Wang, Jie Feng, Zhixiang Wu, Jun Wang, Shih-Fu Chang

CVPR 2014 Hash-SVM: Scalable Kernel Machines for Large-Scale Visual Classification Yadong Mu, Gang Hua, Wei Fan, Shih-Fu Chang

CVPR 2014 Locally Linear Hashing for Extracting Non-Linear Manifolds Go Irie, Zhenguo Li, Xiao-Ming Wu, Shih-Fu Chang

ECCV 2014 Recognizing Complex Events in Videos by Learning Key Static-Dynamic Evidences Kuan-Ting Lai, Dong Liu, Ming-Syan Chen, Shih-Fu Chang

CVPR 2014 Video Event Detection by Inferring Temporal Instance Labels Kuan-Ting Lai, Felix X. Yu, Ming-Syan Chen, Shih-Fu Chang

CVPR 2013 A Bayesian Approach to Multimodal Visual Dictionary Learning Go Irie, Dong Liu, Zhenguo Li, Shih-Fu Chang

NeurIPS 2013 Analyzing the Harmonic Structure in Graph-Based Learning Xiao-Ming Wu, Zhenguo Li, Shih-Fu Chang

CVPR 2013 Designing Category-Level Attributes for Discriminative Visual Recognition Felix X. Yu, Liangliang Cao, Rogerio S. Feris, John R. Smith, Shih-Fu Chang

ICCV 2013 Distributed Low-Rank Subspace Segmentation Ameet Talwalkar, Lester Mackey, Yadong Mu, Shih-Fu Chang, Michael I. Jordan

CVPR 2013 Hash Bit Selection: A Unified Solution for Selection Problems in Hashing Xianglong Liu, Junfeng He, Bo Lang, Shih-Fu Chang

CVPR 2013 Label Propagation from ImageNet to 3D Point Clouds Yan Wang, Rongrong Ji, Shih-Fu Chang

ICCV 2013 Large-Scale Video Hashing via Structure Learning Guangnan Ye, Dong Liu, Jun Wang, Shih-Fu Chang

CVPR 2013 Robust Object Co-Detection Xin Guo, Dong Liu, Brendan Jou, Mojun Zhu, Anni Cai, Shih-Fu Chang

CVPR 2013 Sample-Specific Late Fusion for Visual Category Recognition Dong Liu, Kuan-Ting Lai, Guangnan Ye, Ming-Syan Chen, Shih-Fu Chang

JMLR 2013 Semi-Supervised Learning Using Greedy Max-Cut Jun Wang, Tony Jebara, Shih-Fu Chang

ICML 2013 \proptoSVM for Learning with Label Proportions Felix Yu, Dong Liu, Sanjiv Kumar, Jebara Tony, Shih-Fu Chang

ECCV 2012 Accelerated Large Scale Optimization by Concomitant Hashing Yadong Mu, John Wright, Shih-Fu Chang

ICML 2012 Compact Hyperplane Hashing with Bilinear Functions Wei Liu, Jun Wang, Yadong Mu, Sanjiv Kumar, Shih-Fu Chang

CVPR 2012 Exploiting Web Images for Event Recognition in Consumer Videos: A Multiple Source Domain Adaptation Approach Lixin Duan, Dong Xu, Shih-Fu Chang

NeurIPS 2012 Learning with Partially Absorbing Random Walks Xiao-ming Wu, Zhenguo Li, Anthony M. So, John Wright, Shih-fu Chang

CVPR 2012 Mobile Product Search with Bag of Hash Bits and Boundary Reranking Junfeng He, Jinyuan Feng, Xianglong Liu, Tao Cheng, Tai-Hsu Lin, Hyunjin Chung, Shih-Fu Chang

ICML 2012 On the Difficulty of Nearest Neighbor Search Junfeng He, Sanjiv Kumar, Shih-Fu Chang

CVPR 2012 Robust Late Fusion with Rank Minimization Guangnan Ye, Dong Liu, I-Hong Jhuo, Shih-Fu Chang

CVPR 2012 Robust Visual Domain Adaptation with Low-Rank Reconstruction I-Hong Jhuo, Dong Liu, D. T. Lee, Shih-Fu Chang

ECCV 2012 Scene Aligned Pooling for Complex Video Recognition Liangliang Cao, Yadong Mu, Apostol Natsev, Shih-Fu Chang, Gang Hua, John R. Smith

CVPR 2012 Segmentation Using Superpixels: A Bipartite Graph Partitioning Approach Zhenguo Li, Xiao-Ming Wu, Shih-Fu Chang

CVPR 2012 Spherical Hashing Jae-Pil Heo, Youngwoon Lee, Junfeng He, Shih-Fu Chang, Sung-Eui Yoon

CVPR 2012 Supervised Hashing with Kernels Wei Liu, Jun Wang, Rongrong Ji, Yu-Gang Jiang, Shih-Fu Chang

CVPR 2012 Weak Attributes for Large-Scale Image Retrieval Felix X. Yu, Rongrong Ji, Ming-Hen Tsai, Guangnan Ye, Shih-Fu Chang

CVPR 2011 Compact Hashing with Joint Optimization of Search Accuracy and Time Junfeng He, Shih-Fu Chang, Regunathan Radhakrishnan, Claus Bauer

ICML 2011 Hashing with Graphs Wei Liu, Jun Wang, Sanjiv Kumar, Shih-Fu Chang

ICCV 2011 Learning Component-Level Sparse Representation Using Histogram Information for Image Classification Chen-Kuo Chiang, Chih-Hsueh Duan, Shang-Hong Lai, Shih-Fu Chang

CVPR 2011 Noise Resistant Graph Ranking for Improved Web Image Search Wei Liu, Yu-Gang Jiang, Jiebo Luo, Shih-Fu Chang

ICML 2010 Large Graph Construction for Scalable Semi-Supervised Learning Wei Liu, Junfeng He, Shih-Fu Chang

CVPR 2010 Semi-Supervised Hashing for Scalable Image Retrieval Jun Wang, Ondrej Kumar, Shih-Fu Chang

ICML 2010 Sequential Projection Learning for Hashing with Compact Codes Jun Wang, Sanjiv Kumar, Shih-Fu Chang

ICCV 2009 Domain Adaptive Semantic Diffusion for Large Scale Context-Based Video Annotation Yu-Gang Jiang, Jun Wang, Shih-Fu Chang, Chong-Wah Ngo

ICML 2009 Graph Construction and B-Matching for Semi-Supervised Learning Tony Jebara, Jun Wang, Shih-Fu Chang

CVPR 2009 Label Diagnosis Through Self Tuning Forweb Image Search Jun Wang, Yu-Gang Jiang, Shih-Fu Chang

CVPR 2009 Robust Multi-Class Transductive Learning with Graphs Wei Liu, Shih-Fu Chang

CVPR 2008 Active Microscopic Cellular Image Annotation by Superposable Graph Transduction with Imbalanced Labels Jun Wang, Shih-Fu Chang, Xiaobo Zhou, Stephen T. C. Wong

CVPR 2008 Fast Kernel Learning for Spatial Pyramid Matching Junfeng He, Shih-Fu Chang, Lexing Xie

ICML 2008 Graph Transduction via Alternating Minimization Jun Wang, Tony Jebara, Shih-Fu Chang

CVPR 2008 Near Duplicate Image Identification with Patially Aligned Pyramid Matching Dong Xu, Tat-Jen Cham, Shuicheng Yan, Shih-Fu Chang

ECCV 2008 Semantic Concept Classification by Joint Semi-Supervised Learning of Feature Subspaces and Support Vector Machines Wei Jiang, Shih-Fu Chang, Tony Jebara, Alexander C. Loui

CVPR 2008 Semi-Supervised Distance Metric Learning for Collaborative Image Retrieval Steven C. H. Hoi, Wei Liu, Shih-Fu Chang

CVPR 2007 Element Rearrangement for Tensor-Based Subspace Learning Shuicheng Yan, Dong Xu, Stephen Lin, Thomas S. Huang, Shih-Fu Chang

CVPR 2007 Kernel Sharing with Joint Boosting for Multi-Class Concept Detection Wei Jiang, Shih-Fu Chang, Alexander C. Loui

CVPR 2007 Using Geometry Invariants for Camera Response Function Estimation Tian-Tsong Ng, Shih-Fu Chang, Mao-Pei Tsui

CVPR 2007 Visual Event Recognition in News Video Using Kernel Methods with Multi-Level Temporal Alignment Dong Xu, Shih-Fu Chang

CVPR 2006 A Generative-Discriminative Hybrid Method for Multi-View Object Detection DongQing Zhang, Shih-Fu Chang

ECCV 2006 Modeling the Activity Pattern of the Constellation of Cardiac Chambers in Echocardiogram Videos Shahram Ebadollahi, Shih-Fu Chang, Henry D. Wu

CVPR 2004 Automatic View Recognition in Echocardiogram Videos Using Parts-Based Representation Shahram Ebadollahi, Shih-Fu Chang, Henry D. Wu

CVPR 2004 Learning to Detect Scene Text Using a Higher-Order MRF with Belief Propagation Dong-Qing Zhang, Shih-Fu Chang

CVPRW 2004 Learning to Detect Scene Text Using a Higher-Order MRF with Belief Propagation Dong-Qing Zhang, Shih-Fu Chang

CVPR 2003 A Bayesian Framework for Fusing Multiple Word Knowledge Models in Videotext Recognition DongQing Zhang, Shih-Fu Chang