Song, Ruihua

15 publications

CVPR 2025 Animate and Sound an Image Xihua Wang, Ruihua Song, Chongxuan Li, Xin Cheng, Boyuan Li, Yihan Wu, Yuyue Wang, Hongteng Xu, Yunfeng Wang

ICCV 2025 ETVA: Evaluation of Text-to-Video Alignment via Fine-Grained Question Generation and Answering Kaisi Guan, Zhengfeng Lai, Yuchong Sun, Peng Zhang, Wei Liu, Kieran Liu, Meng Cao, Ruihua Song

AAAI 2025 Enhancing Audiovisual Speech Recognition Through Bifocal Preference Optimization Yihan Wu, Yichen Lu, Yifan Peng, Xihua Wang, Ruihua Song, Shinji Watanabe

AAAI 2025 EyEar: Learning Audio Synchronized Human Gaze Trajectory Based on Physics-Informed Dynamics Xiaochuan Liu, Xin Cheng, Yuchong Sun, Xiaoxue Wu, Ruihua Song, Hao Sun, Denghao Zhang

NeurIPS 2025 Think Silently, Think Fast: Dynamic Latent Compression of LLM Reasoning Chains Wenhui Tan, Jiaze Li, Jianzhong Ju, Zhenbo Luo, Ruihua Song, Jian Luan

ICLR 2025 Think Then React: Towards Unconstrained Action-to-Reaction Motion Generation Wenhui Tan, Boyuan Li, Chuhao Jin, Wenbing Huang, Xiting Wang, Ruihua Song

WACV 2025 Transferring Foundation Models for Generalizable Robotic Manipulation Jiange Yang, Wenhui Tan, Chuhao Jin, Keling Yao, Bei Liu, Jianlong Fu, Ruihua Song, Gangshan Wu, Limin Wang

ICCV 2025 VAFlow: Video-to-Audio Generation with Cross-Modality Flow Matching Xihua Wang, Xin Cheng, Yuyue Wang, Ruihua Song, Yunfeng Wang

NeurIPSW 2024 LoVA: Long-Form Video-to-Audio Generation Xin Cheng, Xihua Wang, Yihan Wu, Yuyue Wang, Ruihua Song

ICLR 2023 CLIP-ViP: Adapting Pre-Trained Image-Text Model to Video-Language Alignment Hongwei Xue, Yuchong Sun, Bei Liu, Jianlong Fu, Ruihua Song, Houqiang Li, Jiebo Luo

AAAI 2023 VideoDubber: Machine Translation with Speech-Aware Length Control for Video Dubbing Yihan Wu, Junliang Guo, Xu Tan, Chen Zhang, Bohan Li, Ruihua Song, Lei He, Sheng Zhao, Arul Menezes, Jiang Bian

NeurIPS 2022 Long-Form Video-Language Pre-Training with Multimodal Temporal Contrastive Learning Yuchong Sun, Hongwei Xue, Ruihua Song, Bei Liu, Huan Yang, Jianlong Fu

IJCAI 2017 Understanding People Lifestyles: Construction of Urban Movement Knowledge Graph from GPS Trajectory Chenyi Zhuang, Nicholas Jing Yuan, Ruihua Song, Xing Xie, Qiang Ma

IJCAI 2015 Mobile Query Recommendation via Tensor Function Learning Zhou Zhao, Ruihua Song, Xing Xie, Xiaofei He, Yueting Zhuang

AAAI 2007 Template-Independent News Extraction Based on Visual Consistency Shuyi Zheng, Ruihua Song, Ji-Rong Wen