1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

以下是原文 正文:【智谱开源文生图模型 CogView3-Plus,相关功能已上线智谱清言App】 智谱技术团队于10月14日宣布开源文生图模型CogView3及其增强版CogView3-Plus-3B,这些模型现已集成至“智谱清言”App。CogView3是一个基于级联扩散的文本转图像模型,分为三个阶段:生成低分辨率图像、进行超分辨率处理至1024x1024,最后迭代生成2048x2048高分辨率图像。在实际应用中,CogView3表现出色,人工评估得分超越当前最佳开源文本到图像扩散模型SDXL77.0%,且推理速度仅为SDXL的1/10。而CogView3-Plus在此基础上引入DiT框架,优化了性能,采用Zero-SNR扩散噪声调度和文本-图像联合注意力机制,相较于MMDiT结构,它在保持基本能力的同时,有效降低了训练和推理成本。此外,该模型使用潜在维度为16的VAE。开发者可通过以下链接获取模型:[链接1]、[链接2]、[链接3]。

原文链接
本文链接:https://kx.umi6.com/article/7340.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
工信部:加强数字经济、人工智能等重点领域、新兴领域、涉外领域立法研究储备
2025-07-17 21:31:28
原价 20 美元 Pro 会员喜加 1 个月:Perplexity AI 上线大学生教育优惠计划
2025-07-18 22:45:59
工信部:加快实施“人工智能+”行动 推动大模型在制造业重点行业落地部署
2025-07-18 16:44:49
24小时热文
更多
扫一扫体验小程序