Wang, Yongqi

15 publications

CVPRW 2025 Cross-Modal Facial Expression Recognition with Global Channel-Spatial Attention: Modal Enhancement and Proportional Criterion Fusion Jun Yu, Yang Zheng, Lei Wang, Yongqi Wang, Shengfan Xu

CVPRW 2025 Dual-Stage Cross-Modal Network with Dynamic Feature Fusion for Emotional Mimicry Intensity Estimation Jun Yu, Lingsi Zhu, Yanjun Chi, Yunxiang Zhang, Yang Zhen, Yongqi Wang, Xilong Lu

CVPRW 2025 Interactive Multimodal Framework with Temporal Modeling for Emotion Recognition Jun Yu, Yongqi Wang, Lei Wang, Yang Zheng, Shengfan Xu

IJCAI 2025 METOR: A Unified Framework for Mutual Enhancement of Objects and Relationships in Open-Vocabulary Video Visual Relationship Detection Yongqi Wang, Xinxiao Wu, Shuo Yang

CVPRW 2025 Robust Stage-Wise LVLM Adaptation: Multi-Phase Prompt LoRA Fine-Tuning for Compound Expression Recognition Xilong Lu, Jun Yu, Yunxiang Zhang, Lingsi Zhu, Yang Zheng, Yongqi Wang, Qiang Ling

AAAI 2025 TechSinger: Technique Controllable Multilingual Singing Voice Synthesis via Flow Matching Wenxiang Guo, Yu Zhang, Changhao Pan, Rongjie Huang, Li Tang, Ruiqi Li, Zhiqing Hong, Yongqi Wang, Zhou Zhao

CVPRW 2025 Towards Robust Multimodal AU Detection: STN-Enhanced Visual Encoding and Audio-Visual Spatial-Temporal Alignment Jun Yu, Yunxiang Zhang, Fengzhao Sun, Leilei Wang, Renjie Lu, Lingsi Zhu, Xilong Lu, Yang Zheng, Yongqi Wang

CVPRW 2024 AUD-TGN: Advancing Action Unit Detection with Temporal Convolution and GPT-2 in Wild Audiovisual Contexts Jun Yu, Zerui Zhang, Zhihong Wei, Gongpeng Zhao, Zhongpeng Cai, Yongqi Wang, Guochen Xie, Jichao Zhu, Wangyuan Zhu, Qingsong Liu, Jiaen Liang

CVPRW 2024 Exploring Facial Expression Recognition Through Semi-Supervised Pre-Training and Temporal Modeling Jun Yu, Zhihong Wei, Zhongpeng Cai, Gongpeng Zhao, Zerui Zhang, Yongqi Wang, Guochen Xie, Jichao Zhu, Wangyuan Zhu, Qingsong Liu, Jiaen Liang

NeurIPS 2024 Frieren: Efficient Video-to-Audio Generation Network with Rectified Flow Matching Yongqi Wang, Wenxiang Guo, Rongjie Huang, Jiawei Huang, Zehan Wang, Fuming You, Ruiqi Li, Zhou Zhao

CVPRW 2024 Improving Valence-Arousal Estimation with Spatiotemporal Relationship Learning and Multimodal Fusion Jun Yu, Gongpeng Zhao, Yongqi Wang, Zhihong Wei, Zerui Zhang, Zhongpeng Cai, Guochen Xie, Jichao Zhu, Wangyuan Zhu, Shuoping Yang, Yang Zheng, Qingsong Liu, Jiaen Liang

ICML 2024 InstructSpeech: Following Speech Editing Instructions via Large Language Models Rongjie Huang, Ruofan Hu, Yongqi Wang, Zehan Wang, Xize Cheng, Ziyue Jiang, Zhenhui Ye, Dongchao Yang, Luping Liu, Peng Gao, Zhou Zhao

NeurIPS 2024 MoMu-Diffusion: On Learning Long-Term Motion-Music Synchronization and Correspondence Fuming You, Minghui Fang, Li Tang, Rongjie Huang, Yongqi Wang, Zhou Zhao

AAAI 2024 Multi-Modal Prompting for Open-Vocabulary Video Visual Relationship Detection Shuo Yang, Yongqi Wang, Xiaofeng Ji, Xinxiao Wu

NeurIPS 2023 Connecting Multi-Modal Contrastive Representations Zehan Wang, Yang Zhao, Xize 成, Haifeng Huang, Jiageng Liu, Aoxiong Yin, Li Tang, Linjun Li, Yongqi Wang, Ziang Zhang, Zhou Zhao