首个沉浸式体积视频数据集ImViD上线,定义沉浸式媒体新形态
Meta用天价打造“元宇宙”却受制于卡通画风,Vision Pro的3-DoF体验让用户眩晕,苹果穹顶摄影棚仅能产出“人像手办”……这一切表明,没有高保真体积视频的元宇宙只是高清版《我的世界》。
清华大学-咪咕团队在CVPR 2025发布《ImViD: 动态体积视频重建与渲染》,从360°真实光场到多模态6-DoF交互,将VR体验推向“穿越时空的在场感”。
传统体积视频面临三大挑战:Google的光场支持6-DoF但视角有限,Apple的视频提供环绕声但仅限3-DoF,Infinite Reality的空间捕获虽高精度但成本高昂且适用范围窄。
ImViD突破四大瓶颈:全视角覆盖、大空间交互、多模态采集、长时长内容。团队构建了全球首个多模态体积视频数据集,包含7大场景、13万帧、38分钟内容,支持自由移动与完全沉浸。
硬件方面,团队搭建46台GoPro阵列与可移动平台,毫米级时间同步,支持定点与动态拍摄。光场重建采用STG++算法,声场建模结合HRTF与RIR,实现真实感渲染。
实验显示,STG++达31.24 PSNR、110 FPS,声场感知获专家高度评价。未来,ImViD将在影视、教育、医疗等领域发挥潜力,并推动移动端交互发展。项目主页与代码已全面开源。
原文链接
本文链接:https://kx.umi6.com/article/20120.html
转载请注明文章出处
相关推荐
换一换
27、42、73,DeepSeek这些大模型竟都喜欢这些数
2025-06-19 15:53:04
ICLR 2025 Spotlight:音频生成新突破!港科北邮团队首次通过文本控制声源方向生成音频
2025-02-17 09:42:01
Stable Diffusion 3开源秒翻车,画人好掉san
2024-06-13 19:30:09
全球最大甲骨文“数据集”开源
2024-07-06 03:51:10
国家数据局指导:DexonomySim 具身智能灵巧手多样抓取仿真数据集正式开源发布,用于 AI 机器人训练
2025-09-01 23:24:23
傅利叶开源全尺寸人形机器人数据集,首批上线超3万条真机数据
2025-03-17 12:36:41
全球首个:智元机器人宣布开源 AgiBot World 百万真机数据集,大幅超越谷歌 Open X-Embodiment
2024-12-30 13:17:17
人形机器人量产落地关键!“天才少年”开源百万真机数据集 动作捕捉或迎广阔增量空间
2024-12-31 08:39:31
蚂蚁数科向全球开源180万深度伪造定位数据集,助力AI算法可解释
2025-08-18 16:48:37
华为云CEO周跃峰:加速医疗AI落地,共建共享行业模型、高质量数据集等
2026-02-02 13:38:37
全球空间智能第一股!浙大清华“三剑客”,英伟达基因,填补两大技术空白
2025-02-17 13:48:24
香港大学李弘扬:「2025年具身智能新一代闭环智能系统」迫在眉睫丨具身先锋十人谈
2025-02-21 17:59:53
全自动组装家具,斯坦福发布 IKEA Video Manuals 数据集
2024-12-03 11:14:31
699 文章
558428 浏览
24小时热文
更多
-
2026-04-24 17:27:38 -
2026-04-24 17:26:33 -
2026-04-24 17:25:23