Choi, Jeongsoo

9 publications

ICLR 2025 ARLON: Boosting Diffusion Transformers with Autoregressive Models for Long Video Generation Zongyi Li, Shujie Hu, Shujie Liu, Long Zhou, Jeongsoo Choi, Lingwei Meng, Xun Guo, Jinyu Li, Hefei Ling, Furu Wei

CVPR 2025 From Faces to Voices: Learning Hierarchical Representations for High-Quality Video-to-Speech Ji-Hoon Kim, Jeongsoo Choi, Jaehun Kim, Chaeyoung Jung, Joon Son Chung

ICCV 2025 MAVFlow: Preserving Paralinguistic Elements with Conditional Flow Matching for Zero-Shot AV2AV Multilingual Translation Sungwoo Cho, Jeongsoo Choi, Sungnyun Kim, Se-Young Yun

ICCV 2025 VoiceCraft-Dub: Automated Video Dubbing with Neural Codec Language Models Kim Sung-Bin, Jeongsoo Choi, Puyuan Peng, Joon Son Chung, Tae-Hyun Oh, David Harwath

CVPR 2024 AV2AV: Direct Audio-Visual Speech to Audio-Visual Speech Translation with Unified Audio-Visual Speech Representation Jeongsoo Choi, Se Jin Park, Minsu Kim, Yong Man Ro

ICCV 2023 DiffV2S: Diffusion-Based Video-to-Speech Synthesis with Vision-Guided Speaker Embedding Jeongsoo Choi, Joanna Hong, Yong Man Ro

ICCV 2023 Lip Reading for Low-Resource Languages by Learning and Combining General Speech Knowledge and Language-Specific Knowledge Minsu Kim, Jeong Hun Yeo, Jeongsoo Choi, Yong Man Ro

CVPR 2023 Watch or Listen: Robust Audio-Visual Speech Recognition with Visual Corruption Modeling and Reliability Scoring Joanna Hong, Minsu Kim, Jeongsoo Choi, Yong Man Ro

AAAI 2022 SyncTalkFace: Talking Face Generation with Precise Lip-Syncing via Audio-Lip Memory Se Jin Park, Minsu Kim, Joanna Hong, Jeongsoo Choi, Yong Man Ro