Essa, Irfan

26 publications

CVPR 2025 Calibrated Multi-Preference Optimization for Aligning Diffusion Models Kyungmin Lee, Xiahong Li, Qifei Wang, Junfeng He, Junjie Ke, Ming-Hsuan Yang, Irfan Essa, Jinwoo Shin, Feng Yang, Yinxiao Li

CVPR 2025 Cropper: Vision-Language Model for Image Cropping Through In-Context Learning Seung Hyun Lee, Jijun Jiang, Yiran Xu, Zhuofang Li, Junjie Ke, Yinxiao Li, Junfeng He, Steven Hickson, Katie Datsenko, Sangpil Kim, Ming-Hsuan Yang, Irfan Essa, Feng Yang

AAAI 2025 Limitations in Employing Natural Language Supervision for Sensor-Based Human Activity Recognition - And Ways to Overcome Them Harish Haresamudram, Apoorva Beedu, Mashfiqui Rabbi, Sankalita Saha, Irfan Essa, Thomas Ploetz

NeurIPS 2024 FineStyle: Fine-Grained Controllable Style Personalization for Text-to-Image Models Gong Zhang, Kihyuk Sohn, Meera Hahn, Humphrey Shi, Irfan Essa

ICLR 2024 Language Model Beats Diffusion - Tokenizer Is Key to Visual Generation Lijun Yu, Jose Lezama, Nitesh Bharadwaj Gundavarapu, Luca Versari, Kihyuk Sohn, David Minnen, Yong Cheng, Agrim Gupta, Xiuye Gu, Alexander G Hauptmann, Boqing Gong, Ming-Hsuan Yang, Irfan Essa, David A Ross, Lu Jiang

ECCV 2024 Parrot: Pareto-Optimal Multi-Reward Reinforcement Learning Framework for Text-to-Image Generation Seung Hyun Lee, Yinxiao Li, Junjie Ke, Innfarn Yoo, Han Zhang, Jiahui Yu, Qifei Wang, Fei Deng, Glenn Entis, Junfeng He, Gang Li, Sangpil Kim, Irfan Essa, Feng Yang

ECCV 2024 Photorealistic Video Generation with Diffusion Models Agrim Gupta, Lijun Yu, Kihyuk Sohn, Xiuye Gu, Meera Hahn, Li Fei-Fei, Irfan Essa, Lu Jiang, Jose Lezama

CVPR 2024 Prompt-Free Diffusion: Taking "Text" Out of Text-to-Image Diffusion Models Xingqian Xu, Jiayi Guo, Zhangyang Wang, Gao Huang, Irfan Essa, Humphrey Shi

CVPRW 2024 SLAIM: Robust Dense Neural SLAM for Online Tracking and Mapping Vincent Cartillier, Grant Schindler, Irfan Essa

ICML 2024 VideoPoet: A Large Language Model for Zero-Shot Video Generation Dan Kondratyuk, Lijun Yu, Xiuye Gu, Jose Lezama, Jonathan Huang, Grant Schindler, Rachel Hornung, Vighnesh Birodkar, Jimmy Yan, Ming-Chang Chiu, Krishna Somandepalli, Hassan Akbari, Yair Alon, Yong Cheng, Joshua V. Dillon, Agrim Gupta, Meera Hahn, Anja Hauth, David Hendon, Alonso Martinez, David Minnen, Mikhail Sirotenko, Kihyuk Sohn, Xuan Yang, Hartwig Adam, Ming-Hsuan Yang, Irfan Essa, Huisheng Wang, David A Ross, Bryan Seybold, Lu Jiang

ICLR 2023 Discrete Predictor-Corrector Diffusion Models for Image Synthesis Jose Lezama, Tim Salimans, Lu Jiang, Huiwen Chang, Jonathan Ho, Irfan Essa

ICLR 2023 Emergence of Maps in the Memories of Blind Navigation Agents Erik Wijmans, Manolis Savva, Irfan Essa, Stefan Lee, Ari S. Morcos, Dhruv Batra

CVPR 2023 MAGVIT: Masked Generative Video Transformer Lijun Yu, Yong Cheng, Kihyuk Sohn, José Lezama, Han Zhang, Huiwen Chang, Alexander G. Hauptmann, Ming-Hsuan Yang, Yuan Hao, Irfan Essa, Lu Jiang

CVPR 2023 MaskSketch: Unpaired Structure-Guided Masked Image Generation Dina Bashkirova, José Lezama, Kihyuk Sohn, Kate Saenko, Irfan Essa

CVPR 2023 Visual Prompt Tuning for Generative Transfer Learning Kihyuk Sohn, Huiwen Chang, José Lezama, Luisa Polania, Han Zhang, Yuan Hao, Irfan Essa, Lu Jiang

ECCV 2022 BLT: Bidirectional Layout Transformer for Controllable Layout Generation Xiang Kong, Lu Jiang, Huiwen Chang, Han Zhang, Yuan Hao, Haifeng Gong, Irfan Essa

ICLR 2022 Discrete Representations Strengthen Vision Transformer Robustness Chengzhi Mao, Lu Jiang, Mostafa Dehghani, Carl Vondrick, Rahul Sukthankar, Irfan Essa

ECCV 2022 Improved Masked Image Generation with Token-Critic José Lezama, Huiwen Chang, Lu Jiang, Irfan Essa

WACV 2022 Sharing Decoders: Network Fission for Multi-Task Pixel Prediction Steven Hickson, Karthik Raveendran, Irfan Essa

AAAI 2021 Semantic MapNet: Building Allocentric Semantic Maps and Representations from Egocentric Views Vincent Cartillier, Zhile Ren, Neha Jain, Stefan Lee, Irfan Essa, Dhruv Batra

ICLR 2020 DD-PPO: Learning Near-Perfect PointGoal Navigators from 2.5 Billion Frames Erik Wijmans, Abhishek Kadian, Ari Morcos, Stefan Lee, Irfan Essa, Devi Parikh, Manolis Savva, Dhruv Batra

ICLR 2020 Insights on Visual Representations for Embodied Navigation Tasks Erik Wijmans, Julian Straub, Irfan Essa, Dhruv Batra, Judy Hoffman, Ari Morcos

ECCV 2020 Neural Design Network: Graphic Layout Generation with Constraints Hsin-Ying Lee, Lu Jiang, Irfan Essa, Phuong B Le, Haifeng Gong, Ming-Hsuan Yang, Weilong Yang

CVPR 2014 Efficient Hierarchical Graph-Based Segmentation of RGBD Videos Steven Hickson, Stan Birchfield, Irfan Essa, Henrik Christensen

CVPR 2013 Augmenting Bag-of-Words: Data-Driven Discovery of Temporal and Structural Information for Activity Recognition Vinay Bettadapura, Grant Schindler, Thomas Ploetz, Irfan Essa

CVPR 2013 Geometric Context from Videos S. Hussain Raza, Matthias Grundmann, Irfan Essa