CVPR 2025:单图秒变专业影棚,几何/材质/光影全搞定,数据代码开源
如何从一张普通图像准确估计物体的三维法线和材质属性,一直是计算机视觉领域的难题。传统方法需多角度或多光源拍摄,限制了其实用性。
近日,香港中文大学、上海人工智能实验室及南洋理工大学的研究团队联合发表的论文《Neural LightRig: Unlocking Accurate Object Normal and Material Estimation with Multi-Light Diffusion》,被CVPR 2025接收。
Neural LightRig创新性地利用图像扩散模型生成虚拟多光照图像,解决了单图估计法线和PBR材质的不确定性问题。研究首次通过微调预训练扩散模型生成一致性多光照图像序列,采用“混合条件策略”和“双阶段微调策略”,确保颜色和纹理细节的一致性。
团队还设计了基于U-Net的G-buffer重建模型,利用多光照图像辅助法线和材质属性估计,优化目标包括余弦相似度损失和均方误差。数据增强策略提升了模型的泛化能力。
实验显示,Neural LightRig在法线和材质估计上优于现有方法,尤其在真实世界图像中表现出色。开源资源已上线,代码、数据集、预训练模型及论文均可访问。
原文链接
本文链接:https://kx.umi6.com/article/16646.html
转载请注明文章出处
相关推荐
.png)
换一换
CVPR 2025:单图秒变专业影棚,几何/材质/光影全搞定,数据代码开源
2025-04-02 17:33:45
字节跳动发布Seedream 4.0图像创作模型
2025-09-09 13:15:57
全球首款类脑脉冲大模型“瞬悉 1.0”问世,实现全流程国产化
2025-09-09 00:05:10
百度发布文心大模型 X1.1 深度思考模型,整体表现超越 DeepSeek R1
2025-09-09 13:14:51
OpenAI内部大重组
2025-09-08 19:01:56
全网都在玩的生图模型,我用它把iPhone17提前发布了
2025-09-09 16:19:55
Meta超级智能实验室首篇论文:重新定义RAG
2025-09-08 17:00:44
Anthropic的版权诉讼案陷入僵局 法官对15亿美元和解协议仍有质疑
2025-09-09 17:19:03
杭州征求意见:到2030年人工智能核心产业营业收入超6000亿元、规上企业超1000家
2025-09-08 16:01:25
杭州:开发搭载国产人工智能芯片的边缘计算服务器、AI服务器等产品
2025-09-09 14:20:38
Canalys:二季度全球云基础设施服务支出达953亿美元 同比增长22%
2025-09-09 12:14:24
工信部:推动体育器械与人工智能、虚拟现实等新技术融合创新
2025-09-09 17:18:09
大模型破译甲骨文创下新 SOTA,复旦团队推出新框架
2025-09-08 14:00:34
512 文章
195146 浏览
24小时热文
更多

-
2025-09-10 00:24:21
-
2025-09-09 23:22:46
-
2025-09-09 22:23:41