Gao, Ruohan

34 publications

ICCV 2025 AURELIA: Test-Time Reasoning Distillation in Audio-Visual LLMs Sanjoy Chowdhury, Hanan Gani, Nishit Anand, Sayan Nag, Ruohan Gao, Mohamed Elhoseiny, Salman Khan, Dinesh Manocha

ICCV 2025 AVTrustBench: Assessing and Enhancing Reliability and Robustness in Audio-Visual LLMs Sanjoy Chowdhury, Sayan Nag, Subhrajyoti Dasgupta, Yaoting Wang, Mohamed Elhoseiny, Ruohan Gao, Dinesh Manocha

ICCV 2025 Differentiable Room Acoustic Rendering with Multi-View Vision Priors Derong Jin, Ruohan Gao

ICCV 2025 EgoAdapt: Adaptive Multisensory Distillation and Policy Learning for Efficient Egocentric Perception Sanjoy Chowdhury, Subrata Biswas, Sayan Nag, Tushar Nagarajan, Calvin Murdock, Ishwarya Ananthabhotla, Yijun Qian, Vamsi Krishna Ithapu, Dinesh Manocha, Ruohan Gao

ICCV 2025 GenFlowRL: Shaping Rewards with Generative Object-Centric Flow in Visual Reinforcement Learning Kelin Yu, Sheng Zhang, Harshit Soora, Furong Huang, Heng Huang, Pratap Tokekar, Ruohan Gao

CVPR 2025 Hearing Anywhere in Any Environment Xiulong Liu, Anurag Kumar, Paul Calamia, Sebastia V. Amengual, Calvin Murdock, Ishwarya Ananthabhotla, Philip Robinson, Eli Shlizerman, Vamsi Krishna Ithapu, Ruohan Gao

CVPR 2025 Learning to Highlight Audio by Watching Movies Chao Huang, Ruohan Gao, J. M. F. Tsang, Jan Kurcius, Cagdas Bilen, Chenliang Xu, Anurag Kumar, Sanjeel Parekh

AAAI 2025 Multisensory Machine Intelligence Ruohan Gao

CVPR 2024 Hearing Anything Anywhere Mason Long Wang, Ryosuke Sawata, Samuel Clarke, Ruohan Gao, Shangzhe Wu, Jiajun Wu

ECCV 2024 Meerkat: Audio-Visual Large Language Model for Grounding in Space and Time Sanjoy Chowdhury, Sayan Nag, Subhrajyoti Dasgupta, Jun Chen, Mohamed Elhoseiny, Ruohan Gao, Dinesh Manocha

ECCV 2024 Spherical World-Locking for Audio-Visual Localization in Egocentric Videos Heeseung Yun, Ruohan Gao, Ishwarya Ananthabhotla, Anurag Kumar, Jacob Donley, Chao Li, Gunhee Kim, Vamsi Krishna Ithapu, Calvin Murdock

CVPR 2024 The Audio-Visual Conversational Graph: From an Egocentric-Exocentric Perspective Wenqi Jia, Miao Liu, Hao Jiang, Ishwarya Ananthabhotla, James M. Rehg, Vamsi Krishna Ithapu, Ruohan Gao

ICLR 2023 An Extensible Multi-Modal Multi-Task Object Dataset with Materials Trevor Scott Standley, Ruohan Gao, Dawn Chen, Jiajun Wu, Silvio Savarese

TMLR 2023 Learning Object-Centric Neural Scattering Functions for Free-Viewpoint Relighting and Scene Composition Hong-Xing Yu, Michelle Guo, Alireza Fathi, Yen-Yu Chang, Eric Ryan Chan, Ruohan Gao, Thomas Funkhouser, Jiajun Wu

CoRL 2023 NOIR: Neural Signal Operated Intelligent Robots for Everyday Activities Ruohan Zhang, Sharon Lee, Minjune Hwang, Ayano Hiranaka, Chen Wang, Wensi Ai, Jin Jie Ryan Tan, Shreya Gupta, Yilun Hao, Gabrael Levine, Ruohan Gao, Anthony Norcia, Li Fei-Fei, Jiajun Wu

CVPR 2023 RealImpact: A Dataset of Impact Sound Fields for Real Objects Samuel Clarke, Ruohan Gao, Mason Wang, Mark Rau, Julia Xu, Jui-Hsien Wang, Doug L. James, Jiajun Wu

NeurIPS 2023 SoundCam: A Dataset for Finding Humans Using Room Acoustics Mason Wang, Samuel Clarke, Jui-Hsien Wang, Ruohan Gao, Jiajun Wu

CVPR 2023 The ObjectFolder Benchmark: Multisensory Learning with Neural and Real Objects Ruohan Gao, Yiming Dou, Hao Li, Tanmay Agarwal, Jeannette Bohg, Yunzhu Li, Li Fei-Fei, Jiajun Wu

CVPR 2022 ObjectFolder 2.0: A Multisensory Object Dataset for Sim2Real Transfer Ruohan Gao, Zilin Si, Yen-Yu Chang, Samuel Clarke, Jeannette Bohg, Li Fei-Fei, Wenzhen Yuan, Jiajun Wu

CoRL 2022 See, Hear, and Feel: Smart Sensory Fusion for Robotic Manipulation Hao Li, Yizhi Zhang, Junzhe Zhu, Shaoxiong Wang, Michelle A Lee, Huazhe Xu, Edward Adelson, Li Fei-Fei, Ruohan Gao, Jiajun Wu

CVPR 2022 Visual Acoustic Matching Changan Chen, Ruohan Gao, Paul Calamia, Kristen Grauman

NeurIPSW 2022 What Makes Certain Pre-Trained Visual Representations Better for Robotic Learning? Kyle Hsu, Tyler Ga Wei Lum, Ruohan Gao, Shixiang Shane Gu, Jiajun Wu, Chelsea Finn

NeurIPSW 2022 What Makes Certain Pre-Trained Visual Representations Better for Robotic Learning? Kyle Hsu, Tyler Ga Wei Lum, Ruohan Gao, Shixiang Shane Gu, Jiajun Wu, Chelsea Finn

NeurIPSW 2022 What Makes Certain Pre-Trained Visual Representations Better for Robotic Learning? Kyle Hsu, Tyler Ga Wei Lum, Ruohan Gao, Shixiang Shane Gu, Jiajun Wu, Chelsea Finn

CoRL 2021 DiffImpact: Differentiable Rendering and Identification of Impact Sounds Samuel Clarke, Negin Heravi, Mark Rau, Ruohan Gao, Jiajun Wu, Doug James, Jeannette Bohg

ICLR 2021 Learning to Set Waypoints for Audio-Visual Navigation Changan Chen, Sagnik Majumder, Ziad Al-Halah, Ruohan Gao, Santhosh Kumar Ramakrishnan, Kristen Grauman

CoRL 2021 ObjectFolder: A Dataset of Objects with Implicit Visual, Auditory, and Tactile Representations Ruohan Gao, Yen-Yu Chang, Shivani Mall, Li Fei-Fei, Jiajun Wu

CVPR 2021 VisualVoice: Audio-Visual Speech Separation with Cross-Modal Consistency Ruohan Gao, Kristen Grauman

ECCV 2020 VisualEchoes: Spatial Image Representation Learning Through Echolocation Ruohan Gao, Changan Chen, Ziad Al-Halah, Carl Schissler, Kristen Grauman

CVPRW 2019 2.5d Visual Sound Ruohan Gao, Kristen Grauman

ECCV 2018 Learning to Separate Object Sounds by Watching Unlabeled Video Ruohan Gao, Rogerio Feris, Kristen Grauman

CVPRW 2018 Learning to Separate Object Sounds by Watching Unlabeled Video Ruohan Gao, Rogério Schmidt Feris, Kristen Grauman

ECCV 2018 ShapeCodes: Self-Supervised Feature Learning by Lifting Views to Viewgrids Dinesh Jayaraman, Ruohan Gao, Kristen Grauman

ICCV 2017 On-Demand Learning for Deep Image Restoration Ruohan Gao, Kristen Grauman