1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:腾讯开源最强3D生成模型,消费级显卡即可运行 | CVPR

正文:
就在刚刚的CVPR会议上,腾讯宣布开源其最新的3D生成模型——混元3D 2.1。这款模型能够细腻呈现流行IP Labubu,并能生成复古风格的青铜器纹理,展现了几何与纹理双重优化的强大能力。相比前一代2.0版本,2.1版本在纹理贴面方面显著提升,达到了当前开源3D模型中的最高水平(SOTA)。

例如,金属质地的葡萄型摆件展示了2.1版本与2.0版本在质感和光泽上的明显差异。此外,混元3D 2.1的训练代码、模型权重和数据处理流程均已开源,支持一键部署,并允许开发者根据需求进行个性化调整。

该模型是首个全链路开源的工业级3D生成大模型,性能媲美闭源模型,且可在消费级显卡上运行。技术层面,混元3D 2.1通过“几何-纹理解耦”架构优化细节建模,提升网格精度,并引入PBR(基于物理的渲染)技术,显著增强模型在不同光照条件下的视觉一致性。用户盲测显示,其PBR纹理的质感胜出率达78%,远超传统RGB贴图技术。

混元3D 2.1还提供了详细的部署教程,方便开发者快速上手。自2024年11月首次开源以来,混元3D系列模型已在全球范围内收获超过180万次下载。

未来,腾讯混元团队希望与全球开发者共同推动3D开源生态的发展。更多详情可访问项目地址或体验地址,还可关注6月15日的直播活动。

原文链接
本文链接:https://kx.umi6.com/article/20237.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
腾讯混元 3D 生成模型升级 2.5 版本:建模精细度提升,免费生成额度翻倍
2025-04-23 18:07:16
腾讯开源混元语音数字人模型:一张图一段音频就能让图中人物说话唱歌
2025-05-28 18:12:03
字节发布豆包视觉理解、3D 生成等新模型,豆包音乐模型可生成 3 分钟作品
2024-12-18 12:27:58
24小时热文
更多
扫一扫体验小程序