1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:浙大团队提出“体素对齐”,革新前馈3D高斯泼溅方法

正文:
在三维重建技术快速发展的今天,前馈式3D Gaussian Splatting(Feed-Forward 3DGS)正成为产业化的热点。然而,现有方法多采用“像素对齐”策略,将2D像素映射到3D高斯,存在两大问题:二维特征难以在三维中精确对齐,且高斯数量受限于像素网格,无法智能分配。

浙大团队提出的VolSplat框架创新性地采用“体素对齐”策略,在三维空间中融合多视角信息,从根本上解决了上述难题。实验表明,VolSplat在RealEstate10K和ScanNet等数据集上的视觉质量和几何一致性均优于传统方法,同时展现出强大的跨数据集泛化能力。

VolSplat的核心思路是将“对齐”从二维提升到三维。通过每视图预测的深度图,将2D特征反投影并聚合到统一的三维体素网格中,再利用稀疏3D U-Net进行多尺度特征细化与高斯参数回归。这一方法带来了四大优势:
1. 跨视图一致性增强:信息在三维空间中融合,避免了2D特征匹配的不稳定性;
2. 高斯密度动态分配:复杂区域高密度、平坦区域低密度,资源分配更高效;
3. 几何一致性更强:减少浮空伪影和几何畸变,细节表现更清晰;
4. 易与外部3D信号融合:深度图、点云等可自然融入流程,无需复杂操作。

VolSplat的整体流程分为三步:
1. 2D特征提取与深度估计:使用共享编码器提取图像特征,并生成稠密深度图;
2. 像素到体素转换:将像素反投影到三维空间,离散化为体素并聚合特征;
3. 稀疏3D细化与高斯回归:通过3D U-Net优化体素特征,并在占据体素上回归高斯参数。

实验结果显示,VolSplat在边缘、细节和复杂几何处理上表现出色,尤其在未见过的数据集上仍保持高性能(如ACID数据集PSNR达32.65dB)。其成果可广泛应用于虚拟看房、机器人感知、AR/VR等领域,为三维重建研究提供了新方向。

论文链接:https://arxiv.org/abs/2509.19297
项目主页:https://lhmd.top/volsplat

原文链接
本文链接:https://kx.umi6.com/article/26072.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
前馈3D高斯泼溅新方法,浙大团队提出“体素对齐”,直接在三维空间融合多视角2D信息
2025-09-29 17:11:46
六部门:实施智能装备创新发展工程 突破发展智能机器人等高端装备
2025-09-29 16:11:54
微亿智造冲刺港交所,工业具身智能机器人第一股
2025-09-29 13:09:50
三星半导体:CXL 3.1 CMM-D 内存、512TB 级 PCIe 6.0 固态硬盘明后年见
2025-09-29 12:08:03
关节精密轴产品已提交给客户验厂审核 机器人概念股10天6板 本周机构密集调研相关上市公司
2025-09-28 22:00:37
商汤Seko上线一个月,超10万创作者选择它
2025-09-29 10:05:46
余承东职务更新!将成华为“打赢AI关键战役”的核心领导人
2025-09-29 21:15:35
AMD逼急NVIDIA!Rubin AI芯片参数猛增:TGP、带宽双双飙升
2025-09-29 12:09:12
大佬连发警告,“人类只剩最后5年”
2025-09-29 13:10:33
阿里 Qwen-Image-Edit-2509 模型更新发布,支持多图编辑、单图一致性提升
2025-09-29 20:13:53
国家发展改革委主任郑栅洁主持召开座谈会 就“十五五”时期扩大有效投资听取民营企业意见建议
2025-09-28 16:57:51
阿里云官宣“全栈人工智能服务商”新定位 全球首创CXL数据库服务器 带来哪些变革?
2025-09-29 19:16:24
DeepMind率先提出CoF:视频模型有自己的思维链
2025-09-28 11:52:38
24小时热文
更多
扫一扫体验小程序