Raj, Bhiksha

57 publications

ICLR 2025 ADIFF: Explaining Audio Difference Using Natural Language Soham Deshmukh, Shuo Han, Rita Singh, Bhiksha Raj

AAAI 2025 Audio Entailment: Assessing Deductive Reasoning for Audio Understanding Soham Deshmukh, Shuo Han, Hazim T. Bukhari, Benjamin Elizalde, Hannes Gamper, Rita Singh, Bhiksha Raj

ICLRW 2025 Did You Hear That? Introducing AADG: A Framework for Generating Benchmark Data in Audio Anomaly Detection Ksheeraja Raghavan, Samiran Gode, Ankit Shah, Surabhi Raghavan, Wolfram Burgard, Bhiksha Raj, Rita Singh

NeurIPS 2025 Directed-Tokens: A Robust Multi-Modality Alignment Approach to Large Language-Vision Models Thanh-Dat Truong, Huu-Thien Tran, Tran Thai Son, Bhiksha Raj, Khoa Luu

CVPR 2025 FALCON: Fairness Learning via Contrastive Attention Approach to Continual Semantic Scene Understanding Thanh-Dat Truong, Utsav Prabhu, Bhiksha Raj, Jackson Cothren, Khoa Luu

ICLR 2025 ImageFolder: Autoregressive Image Generation with Folded Tokens Xiang Li, Kai Qiu, Hao Chen, Jason Kuen, Jiuxiang Gu, Bhiksha Raj, Zhe Lin

ICML 2025 Masked Autoencoders Are Effective Tokenizers for Diffusion Models Hao Chen, Yujin Han, Fangyi Chen, Xiang Li, Yidong Wang, Jindong Wang, Ze Wang, Zicheng Liu, Difan Zou, Bhiksha Raj

NeurIPS 2025 Mellow: A Small Audio Language Model for Reasoning Soham Deshmukh, Satvik Dixit, Rita Singh, Bhiksha Raj

NeurIPS 2025 On Fairness of Unified Multimodal Large Language Model for Image Generation Ming Liu, Hao Chen, Jindong Wang, Liwen Wang, Bhiksha Raj, Wensheng Zhang

ICLR 2025 Scalable Benchmarking and Robust Learning for Noise-Free Ego-Motion and 3D Reconstruction from Noisy Video Xiaohao Xu, Tianyi Zhang, Shibo Zhao, Xiang Li, Sibo Wang, Yongqi Chen, Ye Li, Bhiksha Raj, Matthew Johnson-Roberson, Sebastian Scherer, Xiaonan Huang

CVPR 2025 SoftVQ-VAE: Efficient 1-Dimensional Continuous Tokenizer Hao Chen, Ze Wang, Xiang Li, Ximeng Sun, Fangyi Chen, Jiang Liu, Jindong Wang, Bhiksha Raj, Zicheng Liu, Emad Barsoum

ICLR 2025 Speech Robust Bench: A Robustness Benchmark for Speech Recognition Muhammad A Shah, David Solans Noguero, Mikko A. Heikkilä, Bhiksha Raj, Nicolas Kourtellis

ICCV 2025 Toward Material-Agnostic System Identification from Videos Yizhou Zhao, Haoyu Chen, Chunjiang Liu, Zhenyang Li, Charles Herrmann, Junhwa Hur, Yinxiao Li, Ming-Hsuan Yang, Bhiksha Raj, Min Xu

ICLR 2025 Unsupervised Disentanglement of Content and Style via Variance-Invariance Constraints Yuxuan Wu, Ziyu Wang, Bhiksha Raj, Gus Xia

ICML 2024 A General Framework for Learning from Weak Supervision Hao Chen, Jindong Wang, Lei Feng, Xiang Li, Yidong Wang, Xing Xie, Masashi Sugiyama, Rita Singh, Bhiksha Raj

ICLRW 2024 AutoPRM: Automating Procedural Supervision for Multi-Step Reasoning via Controllable Question Decomposition Zhaorun Chen, Zhuokai Zhao, Zhihong Zhu, Ruiqi Zhang, Xiang Li, Bhiksha Raj, Huaxiu Yao

ICML 2024 Completing Visual Objects via Bridging Generation and Segmentation Xiang Li, Yinpeng Chen, Chung-Ching Lin, Hao Chen, Kai Hu, Rita Singh, Bhiksha Raj, Lijuan Wang, Zicheng Liu

NeurIPS 2024 EAGLE: Efficient Adaptive Geometry-Based Learning in Cross-View Understanding Thanh-Dat Truong, Utsav Prabhu, Dongyi Wang, Bhiksha Raj, Susan Gauch, Jeyamkondan Subbiah, Khoa Luu

NeurIPS 2024 Imprecise Label Learning: A Unified Framework for Learning with Various Imprecise Label Configurations Hao Chen, Ankit Shah, Jindong Wang, Ran Tao, Yidong Wang, Xiang Li, Xing Xie, Masashi Sugiyama, Rita Singh, Bhiksha Raj

NeurIPS 2024 Metric from Human: Zero-Shot Monocular Metric Depth Estimation via Test-Time Adaptation Yizhou Zhao, Hengwei Bian, Kaihua Chen, Pengliang Ji, Liao Qu, Shao-yu Lin, Weichen Yu, Haoran Li, Hao Chen, Jun Shen, Bhiksha Raj, Min Xu

DMLR 2024 On Catastrophic Inheritance of Large Foundation Models Hao Chen, Bhiksha Raj, Xing Xie, Jindong Wang

CVPR 2024 QDFormer: Towards Robust Audiovisual Segmentation in Complex Environments with Quantization-Based Semantic Decomposition Xiang Li, Jinglu Wang, Xiaohao Xu, Xiulian Peng, Rita Singh, Yan Lu, Bhiksha Raj

ECCV 2024 R^2-Bench: Benchmarking the Robustness of Referring Perception Models Under Perturbations Xiang Li, Kai Qiu, Jinglu Wang, Xiaohao Xu, Kashu Yamazaki, Hao Chen, Rita Singh, Xiaonan Huang, Bhiksha Raj

NeurIPS 2024 Slight Corruption in Pre-Training Data Makes Better Diffusion Models Hao Chen, Yujin Han, Diganta Misra, Xiang Li, Kai Hu, Difan Zou, Masashi Sugiyama, Jindong Wang, Bhiksha Raj

CVPR 2024 Synergistic Global-Space Camera and Human Reconstruction from Videos Yizhou Zhao, Tuanfeng Yang Wang, Bhiksha Raj, Min Xu, Jimei Yang, Chun-Hao Paul Huang

ICLR 2024 Understanding and Mitigating the Label Noise in Pre-Training on Downstream Tasks Hao Chen, Jindong Wang, Ankit Shah, Ran Tao, Hongxin Wei, Xing Xie, Masashi Sugiyama, Bhiksha Raj

CVPR 2023 FREDOM: Fairness Domain Adaptation Approach to Semantic Scene Understanding Thanh-Dat Truong, Ngan Le, Bhiksha Raj, Jackson Cothren, Khoa Luu

NeurIPS 2023 Fairness Continual Learning Approach to Semantic Scene Understanding in Open-World Environments Thanh-Dat Truong, Hoang-Quan Nguyen, Bhiksha Raj, Khoa Luu

ICLR 2023 FreeMatch: Self-Adaptive Thresholding for Semi-Supervised Learning Yidong Wang, Hao Chen, Qiang Heng, Wenxin Hou, Yue Fan, Zhen Wu, Jindong Wang, Marios Savvides, Takahiro Shinozaki, Bhiksha Raj, Bernt Schiele, Xing Xie

ICML 2023 How Many Perturbations Break This Model? Evaluating Robustness Beyond Adversarial Accuracy Raphael Olivier, Bhiksha Raj

NeurIPS 2023 PaintSeg: Painting Pixels for Training-Free Segmentation Xiang Li, Chung-Ching Lin, Yinpeng Chen, Zicheng Liu, Jinglu Wang, Rita Singh, Bhiksha Raj

ICCV 2023 Pairwise Similarity Learning Is SimPLE Yandong Wen, Weiyang Liu, Yao Feng, Bhiksha Raj, Rita Singh, Adrian Weller, Michael J. Black, Bernhard Schölkopf

AAAI 2023 Panoramic Video Salient Object Detection with Ambisonic Audio Guidance Xiang Li, Haoyuan Cao, Shijie Zhao, Junlin Li, Li Zhang, Bhiksha Raj

ICCV 2023 Robust Referring Video Object Segmentation with Cyclic Structural Consensus Xiang Li, Jinglu Wang, Xiaohao Xu, Xiao Li, Bhiksha Raj, Yan Lu

ICLR 2023 SoftMatch: Addressing the Quantity-Quality Tradeoff in Semi-Supervised Learning Hao Chen, Ran Tao, Yue Fan, Yidong Wang, Jindong Wang, Bernt Schiele, Xing Xie, Bhiksha Raj, Marios Savvides

NeurIPS 2023 Training on Foveated Images Improves Robustness to Adversarial Attacks Muhammad Shah, Aqsa Kashaf, Bhiksha Raj

ICMLW 2023 Transferable Adversarial Perturbations Between Self-Supervised Speech Recognition Models Raphael Olivier, Hadi Abdullah, Bhiksha Raj

AAAI 2023 VLTinT: Visual-Linguistic Transformer-in-Transformer for Coherent Video Paragraph Captioning Kashu Yamazaki, Khoa Vo, Quang Sang Truong, Bhiksha Raj, Ngan Le

NeurIPS 2023 Weakly-Supervised Audio-Visual Segmentation Shentong Mo, Bhiksha Raj

ICLR 2022 SphereFace2: Binary Classification Is All You Need for Deep Face Recognition Yandong Wen, Weiyang Liu, Adrian Weller, Bhiksha Raj, Rita Singh

NeurIPS 2022 USB: A Unified Semi-Supervised Learning Benchmark for Classification Yidong Wang, Hao Chen, Yue Fan, Wang Sun, Ran Tao, Wenxin Hou, Renjie Wang, Linyi Yang, Zhi Zhou, Lan-Zhe Guo, Heli Qi, Zhen Wu, Yu-Feng Li, Satoshi Nakamura, Wei Ye, Marios Savvides, Bhiksha Raj, Takahiro Shinozaki, Bernt Schiele, Jindong Wang, Xing Xie, Yue Zhang

ICCV 2021 Contrast and Order Representations for Video Self-Supervised Learning Kai Hu, Jie Shao, Yuan Liu, Bhiksha Raj, Marios Savvides, Zhiqiang Shen

ICCV 2021 Self-Supervised 3D Face Reconstruction via Conditional Estimation Yandong Wen, Weiyang Liu, Bhiksha Raj, Rita Singh

ICCV 2021 The Right to Talk: An Audio-Visual Transformer Approach Thanh-Dat Truong, Chi Nhan Duong, The De Vu, Hoang Anh Pham, Bhiksha Raj, Ngan Le, Khoa Luu

NeurIPS 2020 Is Normalization Indispensable for Training Deep Neural Network? Jie Shao, Kai Hu, Changhu Wang, Xiangyang Xue, Bhiksha Raj

ICLR 2019 Disjoint Mapping Network for Cross-Modal Matching of Voices and Faces Yandong Wen, Mahmoud Al Ismail, Weiyang Liu, Bhiksha Raj, Rita Singh

NeurIPS 2019 Face Reconstruction from Voice Using Generative Adversarial Networks Yandong Wen, Bhiksha Raj, Rita Singh

IJCAI 2019 Learning Sound Events from Webly Labeled Data Anurag Kumar, Ankit Shah, Alexander G. Hauptmann, Bhiksha Raj

CVPR 2017 SphereFace: Deep Hypersphere Embedding for Face Recognition Weiyang Liu, Yandong Wen, Zhiding Yu, Ming Li, Bhiksha Raj, Le Song

CVPRW 2016 The Best of BothWorlds: Combining Data-Independent and Data-Driven Approaches for Action Recognition Zhen-Zhong Lan, Shoou-I Yu, Dezhong Yao, Ming Lin, Bhiksha Raj, Alexander G. Hauptmann

CVPR 2015 Beyond Gaussian Pyramid: Multi-Skip Feature Stacking for Action Recognition Zhengzhong Lan, Ming Lin, Xuanchong Li, Alex G. Hauptmann, Bhiksha Raj

JMLR 2013 Greedy Sparsity-Constrained Optimization Sohail Bahmani, Bhiksha Raj, Petros T. Boufounos

NeurIPS 2012 Unsupervised Structure Discovery for Semantic Analysis of Audio Sourish Chaudhuri, Bhiksha Raj

NeurIPS 2010 Multiparty Differential Privacy via Aggregation of Locally Trained Classifiers Manas Pathak, Shantanu Rane, Bhiksha Raj

NeurIPS 2009 A Sparse Non-Parametric Approach for Single Channel Separation of Known Sounds Paris Smaragdis, Madhusudana Shashanka, Bhiksha Raj

CVPR 2007 Sensor and Data Systems, Audio-Assisted Cameras and Acoustic Doppler Sensors Kaustubh Kalgaonkar, Paris Smaragdis, Bhiksha Raj

NeurIPS 2007 Sparse Overcomplete Latent Variable Decomposition of Counts Data Madhusudana Shashanka, Bhiksha Raj, Paris Smaragdis