1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:浙大团队提出“体素对齐”,革新前馈3D高斯泼溅方法

正文:
在三维重建技术快速发展的今天,前馈式3D Gaussian Splatting(Feed-Forward 3DGS)正成为产业化的热点。然而,现有方法多采用“像素对齐”策略,将2D像素映射到3D高斯,存在两大问题:二维特征难以在三维中精确对齐,且高斯数量受限于像素网格,无法智能分配。

浙大团队提出的VolSplat框架创新性地采用“体素对齐”策略,在三维空间中融合多视角信息,从根本上解决了上述难题。实验表明,VolSplat在RealEstate10K和ScanNet等数据集上的视觉质量和几何一致性均优于传统方法,同时展现出强大的跨数据集泛化能力。

VolSplat的核心思路是将“对齐”从二维提升到三维。通过每视图预测的深度图,将2D特征反投影并聚合到统一的三维体素网格中,再利用稀疏3D U-Net进行多尺度特征细化与高斯参数回归。这一方法带来了四大优势:
1. 跨视图一致性增强:信息在三维空间中融合,避免了2D特征匹配的不稳定性;
2. 高斯密度动态分配:复杂区域高密度、平坦区域低密度,资源分配更高效;
3. 几何一致性更强:减少浮空伪影和几何畸变,细节表现更清晰;
4. 易与外部3D信号融合:深度图、点云等可自然融入流程,无需复杂操作。

VolSplat的整体流程分为三步:
1. 2D特征提取与深度估计:使用共享编码器提取图像特征,并生成稠密深度图;
2. 像素到体素转换:将像素反投影到三维空间,离散化为体素并聚合特征;
3. 稀疏3D细化与高斯回归:通过3D U-Net优化体素特征,并在占据体素上回归高斯参数。

实验结果显示,VolSplat在边缘、细节和复杂几何处理上表现出色,尤其在未见过的数据集上仍保持高性能(如ACID数据集PSNR达32.65dB)。其成果可广泛应用于虚拟看房、机器人感知、AR/VR等领域,为三维重建研究提供了新方向。

论文链接:https://arxiv.org/abs/2509.19297
项目主页:https://lhmd.top/volsplat

原文链接
本文链接:https://kx.umi6.com/article/26072.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
前馈3D高斯泼溅新方法,浙大团队提出“体素对齐”,直接在三维空间融合多视角2D信息
2025-09-29 17:11:46
《三体》“宇宙闪烁”成真!免佩戴裸眼3D屏登Nature
2025-12-06 11:25:22
美团发布并开源 LongCat-Image 图像生成模型,编辑能力登顶开源 SOTA
2025-12-08 10:19:43
跨境电商的疑难杂症,被1688这个AI全包了…
2025-12-07 13:28:44
中国电信董事长柯瑞文:加快推进算力基础设施建设 强化国产算力芯片适配
2025-12-07 21:52:07
特斯拉 Optimus 人形机器人演示时摔倒,手忙脚乱“摘头显”露了馅
2025-12-08 15:33:43
Meta 签约多家媒体,为 Meta AI 聊天机器人带来更多新闻内容
2025-12-08 12:27:32
英伟达巧用8B模型秒掉GPT-5,开源了
2025-12-06 14:32:11
英伟达 4B 小模型击败 GPT-5 Pro!单任务成本仅后者 1/36
2025-12-08 16:36:14
广西“十五五”规划建议:高标准建设中国—东盟国家人工智能应用合作中心
2025-12-07 10:23:39
山东省“十五五”规划建议:大力推进人工智能创新应用 支持创建一批国家人工智能应用中试基地
2025-12-08 09:22:21
Gartner 调查:仅 20% 客服支持主管表示因 AI 削减团队规模
2025-12-08 14:31:10
智谱 GLM-4.6V 系列多模态 AI 大模型发布并开源,API 降价 50%
2025-12-08 20:45:30
24小时热文
更多
扫一扫体验小程序