Jin, Tao

37 publications

AAAI 2025 A Wander Through the Multimodal Landscape: Efficient Transfer Learning via Low-Rank Sequence Multimodal Adapter Zirun Guo, Xize Cheng, Yangyang Wu, Tao Jin

NeurIPS 2025 AHa-Bench: Benchmarking Audio Hallucinations in Large Audio-Language Models Xize Cheng, Dongjie Fu, Chenyuhao Wen, Shannon Yu, Zehan Wang, Shengpeng Ji, Siddhant Arora, Tao Jin, Shinji Watanabe, Zhou Zhao

AAAI 2025 Bridging the Gap for Test-Time Multimodal Sentiment Analysis Zirun Guo, Tao Jin, Wenlong Xu, Wang Lin, Yangyang Wu

CVPR 2025 ConceptGuard: Continual Personalized Text-to-Image Generation with Forgetting and Confusion Mitigation Zirun Guo, Tao Jin

ICLR 2025 Diff-Prompt: Diffusion-Driven Prompt Generator with Mask Supervision Weicai Yan, Wang Lin, Zirun Guo, Ye Wang, Fangming Feng, Xiaoda Yang, Zehan Wang, Tao Jin

ICML 2025 IRBridge: Solving Image Restoration Bridge with Pre-Trained Generative Diffusion Models Hanting Wang, Tao Jin, Wang Lin, Shulei Wang, Hai Huang, Shengpeng Ji, Zhou Zhao

CVPR 2025 Non-Natural Image Understanding with Advancing Frequency-Based Vision Encoders Wang Lin, QingSong Wang, Yueying Feng, Shulei Wang, Tao Jin, Zhou Zhao, Fei Wu, Chang Yao, Jingyuan Chen

ICLR 2025 OmniBind: Large-Scale Omni Multimodal Representation via Binding Spaces Zehan Wang, Ziang Zhang, Minjie Hong, Hang Zhang, Luping Liu, Rongjie Huang, Xize Cheng, Shengpeng Ji, Tao Jin, Hengshuang Zhao, Zhou Zhao

ICLR 2025 OmniSep: Unified Omni-Modality Sound Separation with Query-Mixup Xize Cheng, Siqi Zheng, Zehan Wang, Minghui Fang, Ziang Zhang, Rongjie Huang, Shengpeng Ji, Jialong Zuo, Tao Jin, Zhou Zhao

ICCV 2025 Open-Set Cross Modal Generalization via Multimodal Unified Representation Hai Huang, Yan Xia, Shulei Wang, Hanting Wang, Minghui Fang, Shengpeng Ji, Sashuai Zhou, Tao Jin, Zhou Zhao

ICML 2025 Ranking with Multiple Oracles: From Weak to Strong Stochastic Transitivity Tao Jin, Yue Wu, Quanquan Gu, Farzad Farnoud

ICLR 2025 Smoothing the Shift: Towards Stable Test-Time Adaptation Under Complex Multimodal Noises Zirun Guo, Tao Jin

CVPR 2025 SpatialCLIP: Learning 3D-Aware Image Representations from Spatially Discriminative Language Zehan Wang, Sashuai Zhou, Shaoxuan He, Haifeng Huang, Lihe Yang, Ziang Zhang, Xize Cheng, Shengpeng Ji, Tao Jin, Hengshuang Zhao, Zhou Zhao

AAAI 2025 Speech Watermarking with Discrete Intermediate Representations Shengpeng Ji, Ziyue Jiang, Jialong Zuo, Minghui Fang, Yifu Chen, Tao Jin, Zhou Zhao

CVPR 2025 Towards Transformer-Based Aligned Generation with Self-Coherence Guidance Shulei Wang, Wang Lin, Hai Huang, Hanting Wang, Sihang Cai, WenKang Han, Tao Jin, Jingyuan Chen, Jiacheng Sun, Jieming Zhu, Zhou Zhao

ICLR 2025 VoxDialogue: Can Spoken Dialogue Systems Understand Information Beyond Words? Xize Cheng, Ruofan Hu, Xiaoda Yang, Jingyu Lu, Dongjie Fu, Zehan Wang, Shengpeng Ji, Rongjie Huang, Boyang Zhang, Tao Jin, Zhou Zhao

NeurIPS 2024 $e^3$: Exploring Embodied Emotion Through a Large-Scale Egocentric Video Dataset Wang Lin, Yueying Feng, Wenkang Han, Tao Jin, Zhou Zhao, Fei Wu, Chang Yao, Jingyuan Chen

NeurIPS 2024 Action Imitation in Common Action Space for Customized Action Image Synthesis Wang Lin, Jingyuan Chen, Jiaxin Shi, Zirun Guo, Yichen Zhu, Zehan Wang, Tao Jin, Zhou Zhao, Fei Wu, Shuicheng Yan, Hanwang Zhang

ICML 2024 Borda Regret Minimization for Generalized Linear Dueling Bandits Yue Wu, Tao Jin, Qiwei Di, Hao Lou, Farzad Farnoud, Quanquan Gu

NeurIPS 2024 Classifier-Guided Gradient Modulation for Enhanced Multimodal Learning Zirun Guo, Tao Jin, Jingyuan Chen, Zhou Zhao

CVPR 2024 DART: Implicit Doppler Tomography for Radar Novel View Synthesis Tianshu Huang, John Miller, Akarsh Prabhakara, Tao Jin, Tarana Laroia, Zico Kolter, Anthony Rowe

NeurIPS 2024 Extending Multi-Modal Contrastive Representations Ziang Zhang, Zehan Wang, Luping Liu, Rongjie Huang, Xize Cheng, Zhenhui Ye, Wang Lin, Huadai Liu, Haifeng Huang, Yang Zhao, Tao Jin, Siqi Zheng, Zhou Zhao

ICML 2024 FreeBind: Free Lunch in Unified Multimodal Space via Knowledge Fusion Zehan Wang, Ziang Zhang, Xize Cheng, Rongjie Huang, Luping Liu, Zhenhui Ye, Haifeng Huang, Yang Zhao, Tao Jin, Peng Gao, Zhou Zhao

CVPR 2024 MPOD123: One Image to 3D Content Generation Using Mask-Enhanced Progressive Outline-to-Detail Optimization Jimin Xu, Tianbao Wang, Tao Jin, Shengyu Zhang, Dongjie Fu, Zhe Wang, Jiangjing Lyu, Chengfei Lv, Chaoyue Niu, Zhou Yu, Zhou Zhao, Fei Wu

ICML 2024 Non-Confusing Generation of Customized Concepts in Diffusion Models Wang Lin, Jingyuan Chen, Jiaxin Shi, Yichen Zhu, Chen Liang, Junzhong Miao, Tao Jin, Zhou Zhao, Fei Wu, Shuicheng Yan, Hanwang Zhang

ICLR 2024 Variance-Aware Regret Bounds for Stochastic Contextual Dueling Bandits Qiwei Di, Tao Jin, Yue Wu, Heyang Zhao, Farzad Farnoud, Quanquan Gu

ICMLW 2023 Borda Regret Minimization for Generalized Linear Dueling Bandits Yue Wu, Tao Jin, Qiwei Di, Hao Lou, Farzad Farnoud, Quanquan Gu

CVPR 2023 DATE: Domain Adaptive Product Seeker for E-Commerce Haoyuan Li, Hao Jiang, Tao Jin, Mengyan Li, Yan Chen, Zhijie Lin, Yang Zhao, Zhou Zhao

ICCV 2023 Exploring Group Video Captioning with Efficient Relational Approximation Wang Lin, Tao Jin, Ye Wang, Wenwen Pan, Linjun Li, Xize Cheng, Zhou Zhao

CVPR 2023 Gloss Attention for Gloss-Free Sign Language Translation Aoxiong Yin, Tianyun Zhong, Li Tang, Weike Jin, Tao Jin, Zhou Zhao

ICCV 2023 MixSpeech: Cross-Modality Self-Learning with Audio-Visual Stream Mixup for Visual Speech Translation and Recognition Xize Cheng, Tao Jin, Rongjie Huang, Linjun Li, Wang Lin, Zehan Wang, Ye Wang, Huadai Liu, Aoxiong Yin, Zhou Zhao

AISTATS 2022 Adaptive Sampling for Heterogeneous Rank Aggregation from Noisy Pairwise Comparisons Yue Wu, Tao Jin, Hao Lou, Pan Xu, Farzad Farnoud, Quanquan Gu

NeurIPS 2022 Active Ranking Without Strong Stochastic Transitivity Hao Lou, Tao Jin, Yue Wu, Pan Xu, Quanquan Gu, Farzad Farnoud

NeurIPS 2021 Generalizable Multi-Linear Attention Network Tao Jin, Zhou Zhao

AAAI 2020 Rank Aggregation via Heterogeneous Thurstone Preference Models Tao Jin, Pan Xu, Quanquan Gu, Farzad Farnoud

IJCAI 2020 SBAT: Video Captioning with Sparse Boundary-Aware Transformer Tao Jin, Siyu Huang, Ming Chen, Yingming Li, Zhongfei Zhang

MLJ 2017 Collaborative Topic Regression for Online Recommender Systems: An Online and Bayesian Approach Chenghao Liu, Tao Jin, Steven C. H. Hoi, Peilin Zhao, Jianling Sun