标题:浙大彭思达团队 × 理想研究:突破高分辨率深度细节缺失瓶颈
正文:
在单目深度估计领域,高分辨率输出已成为趋势,但实际应用中仍面临诸多问题。例如,在三维重建和自动驾驶等任务中,物体边缘模糊、细小结构丢失等问题依然存在。这些问题源于现有方法通常在固定分辨率下预测深度,再通过插值放大结果,导致细节区域的误差被放大。
针对这一瓶颈,浙江大学彭思达团队联合理想研究团队提出了一种新方法——《InfiniDepth: Arbitrary-Resolution and Fine-Grained Depth Estimation with Neural Implicit Fields》。该方法从深度表示方式入手,重新设计了高分辨率条件下的建模策略,并通过一系列实验验证其在几何细节恢复和三维任务中的优越性。
研究团队构建了Synth4K数据集,包含来自高质量游戏场景的5个子集,每个子集包含数百张3840×2160分辨率的RGB图像及对应深度图。实验结果显示,InfiniDepth在全图区域和高频细节区域均表现优异。例如,在Synth4K-1上,其δ1指标达到89.0%,显著优于主流方法;在高频区域,其性能下降幅度最小,且领先幅度达5至8个百分点。
此外,InfiniDepth在真实数据集(如KITTI、ETH3D)上的零样本评测也表现出色,证明其连续深度表示对真实场景具有良好的泛化能力。结合稀疏深度提示机制后,其在高精度尺度估计任务中进一步提升,尤其在复杂几何结构区域表现突出。
在新视角合成实验中,InfiniDepth生成的三维点云分布更均匀,减少了几何空洞和断裂现象,为视觉重建和自动驾驶提供了更稳定的几何基础。
研究团队指出,传统方法受限于离散网格预测,而InfiniDepth采用连续空间映射,可直接预测任意坐标位置的深度值,从根本上解决了插值带来的细节损失问题。消融实验进一步证实,连续深度表示和多尺度局部特征查询是性能提升的关键。
总体而言,InfiniDepth不仅在指标上取得突破,更揭示了高分辨率深度估计的核心瓶颈在于表示方式本身。这一研究为单目深度估计的未来发展提供了重要方向。
通讯作者彭思达现为浙江大学研究员,研究方向涵盖三维视觉与神经隐式表示,已在多项国际顶级会议和期刊发表论文,并获多项学术荣誉。他的研究致力于解决实际问题,推动技术在行业中的落地应用。
论文地址:https://arxiv.org/pdf/2601.03252
参考链接:https://pengsida.net/
-
2026-01-14 12:34:18 -
2026-01-14 12:31:30 -
2026-01-14 11:47:21