1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

首个沉浸式体积视频数据集ImViD上线,定义沉浸式媒体新形态

Meta用天价打造“元宇宙”却受制于卡通画风,Vision Pro的3-DoF体验让用户眩晕,苹果穹顶摄影棚仅能产出“人像手办”……这一切表明,没有高保真体积视频的元宇宙只是高清版《我的世界》。

清华大学-咪咕团队在CVPR 2025发布《ImViD: 动态体积视频重建与渲染》,从360°真实光场到多模态6-DoF交互,将VR体验推向“穿越时空的在场感”。

传统体积视频面临三大挑战:Google的光场支持6-DoF但视角有限,Apple的视频提供环绕声但仅限3-DoF,Infinite Reality的空间捕获虽高精度但成本高昂且适用范围窄。

ImViD突破四大瓶颈:全视角覆盖、大空间交互、多模态采集、长时长内容。团队构建了全球首个多模态体积视频数据集,包含7大场景、13万帧、38分钟内容,支持自由移动与完全沉浸。

硬件方面,团队搭建46台GoPro阵列与可移动平台,毫米级时间同步,支持定点与动态拍摄。光场重建采用STG++算法,声场建模结合HRTF与RIR,实现真实感渲染。

实验显示,STG++达31.24 PSNR、110 FPS,声场感知获专家高度评价。未来,ImViD将在影视、教育、医疗等领域发挥潜力,并推动移动端交互发展。项目主页与代码已全面开源。

原文链接
本文链接:https://kx.umi6.com/article/20120.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
中文互联网语料 AI 资源平台发布:27 个数据集、总量 2.7T
2025-01-11 08:32:27
蚂蚁数科向全球开源180万深度伪造定位数据集,助力AI算法可解释
2025-08-18 16:48:37
香港大学李弘扬:「2025年具身智能新一代闭环智能系统」迫在眉睫丨具身先锋十人谈
2025-02-21 17:59:53
空间智能新进展:教机器人组装宜家家具,首次实现操作步骤与真实视频对齐 | NeurIPS
2024-11-26 21:39:56
苹果发布 Pico-Banana-400K 数据集:含 40 万张图像,帮助训练 AI 图像编辑模型
2025-10-29 09:42:14
谷歌全网扒1000亿图像文本对,ViT大佬坐镇:数据Scaling潜力依旧
2025-02-13 18:12:26
大规模多构型具身智能新数据集和基准:5.5万条机器人轨迹数据,279项不同任务
2024-12-27 14:01:36
ICLR 2025 Spotlight:音频生成新突破!港科北邮团队首次通过文本控制声源方向生成音频
2025-02-17 09:42:01
稚晖君后宇树也来玩开源了:机器人操作数据集,采用抱抱脸LeRobot训练测试,网友:泰裤辣!
2024-11-13 15:40:13
全球首个:智元机器人宣布开源 AgiBot World 百万真机数据集,大幅超越谷歌 Open X-Embodiment
2024-12-30 13:17:17
傅利叶开源全尺寸人形机器人数据集,首批上线超3万条真机数据
2025-03-17 12:36:41
国家数据局指导:DexonomySim 具身智能灵巧手多样抓取仿真数据集正式开源发布,用于 AI 机器人训练
2025-09-01 23:24:23
人形机器人:最初的设想,最后的归宿
2025-04-22 08:09:04
24小时热文
更多
扫一扫体验小程序