首个沉浸式体积视频数据集ImViD上线，定义沉浸式媒体新形态丨CVPR‘25 Highlight

2025-06-12 13:32:25

数字墨迹

发布在

科普

阅读：1166

首个沉浸式体积视频数据集ImViD上线，定义沉浸式媒体新形态

Meta用天价打造“元宇宙”却受制于卡通画风，Vision Pro的3-DoF体验让用户眩晕，苹果穹顶摄影棚仅能产出“人像手办”……这一切表明，没有高保真体积视频的元宇宙只是高清版《我的世界》。

清华大学-咪咕团队在CVPR 2025发布《ImViD: 动态体积视频重建与渲染》，从360°真实光场到多模态6-DoF交互，将VR体验推向“穿越时空的在场感”。

传统体积视频面临三大挑战：Google的光场支持6-DoF但视角有限，Apple的视频提供环绕声但仅限3-DoF，Infinite Reality的空间捕获虽高精度但成本高昂且适用范围窄。

ImViD突破四大瓶颈：全视角覆盖、大空间交互、多模态采集、长时长内容。团队构建了全球首个多模态体积视频数据集，包含7大场景、13万帧、38分钟内容，支持自由移动与完全沉浸。

硬件方面，团队搭建46台GoPro阵列与可移动平台，毫米级时间同步，支持定点与动态拍摄。光场重建采用STG++算法，声场建模结合HRTF与RIR，实现真实感渲染。

实验显示，STG++达31.24 PSNR、110 FPS，声场感知获专家高度评价。未来，ImViD将在影视、教育、医疗等领域发挥潜力，并推动移动端交互发展。项目主页与代码已全面开源。

原文链接

本文链接：https://kx.umi6.com/article/20120.html

转载请注明文章出处

ImViD

数据集

沉浸式体积视频

分享至

打开微信扫一扫

内容投诉

生成图片

数字墨迹

648 文章

441486 浏览

24小时热文