1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

CVPR 2025:单图秒变专业影棚,几何/材质/光影全搞定,数据代码开源

如何从一张普通图像准确估计物体的三维法线和材质属性,一直是计算机视觉领域的难题。传统方法需多角度或多光源拍摄,限制了其实用性。

近日,香港中文大学、上海人工智能实验室及南洋理工大学的研究团队联合发表的论文《Neural LightRig: Unlocking Accurate Object Normal and Material Estimation with Multi-Light Diffusion》,被CVPR 2025接收。

Neural LightRig创新性地利用图像扩散模型生成虚拟多光照图像,解决了单图估计法线和PBR材质的不确定性问题。研究首次通过微调预训练扩散模型生成一致性多光照图像序列,采用“混合条件策略”和“双阶段微调策略”,确保颜色和纹理细节的一致性。

团队还设计了基于U-Net的G-buffer重建模型,利用多光照图像辅助法线和材质属性估计,优化目标包括余弦相似度损失和均方误差。数据增强策略提升了模型的泛化能力。

实验显示,Neural LightRig在法线和材质估计上优于现有方法,尤其在真实世界图像中表现出色。开源资源已上线,代码、数据集、预训练模型及论文均可访问。

原文链接
本文链接:https://kx.umi6.com/article/16646.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
DeepSeek终于丢了开源第一王座,但继任者依然来自中国
2025-07-18 17:42:26
达美航空推行 AI 定价策略,目标为每个乘客量身定制“最愿意掏钱”的票价
2025-07-19 22:57:32
利通电子等在上海成立昊利智算公司
2025-07-18 19:45:00
24小时热文
更多
扫一扫体验小程序