以下是原文 正文:【智谱开源文生图模型 CogView3-Plus,相关功能已上线智谱清言App】 智谱技术团队于10月14日宣布开源文生图模型CogView3及其增强版CogView3-Plus-3B,这些模型现已集成至“智谱清言”App。CogView3是一个基于级联扩散的文本转图像模型,分为三个阶段:生成低分辨率图像、进行超分辨率处理至1024x1024,最后迭代生成2048x2048高分辨率图像。在实际应用中,CogView3表现出色,人工评估得分超越当前最佳开源文本到图像扩散模型SDXL77.0%,且推理速度仅为SDXL的1/10。而CogView3-Plus在此基础上引入DiT框架,优化了性能,采用Zero-SNR扩散噪声调度和文本-图像联合注意力机制,相较于MMDiT结构,它在保持基本能力的同时,有效降低了训练和推理成本。此外,该模型使用潜在维度为16的VAE。开发者可通过以下链接获取模型:[链接1]、[链接2]、[链接3]。
原文链接
本文链接:https://kx.umi6.com/article/7340.html
转载请注明文章出处
相关推荐
.png)
换一换
智谱清言 App 视频通话功能面向所有用户限时免费开放:“有了眼睛”的 AI 产品
2024-09-06 17:07:15
智谱开源文生图模型 CogView3-Plus,相关功能上线智谱清言 App
2024-10-15 17:49:24
首个全国产!兆芯、联想开天联合打造AI教室:屏幕巧妙
2025-10-22 17:50:16
英伟达向左,寒武纪向右
2025-10-23 07:58:12
全球首个百亿级可部署基因组基础模型诞生
2025-10-23 07:59:17
Meta将削减人工智能部门约600个职位 以提升决策效率
2025-10-22 23:55:49
大模型推理学习新范式!ExGRPO框架:从盲目刷题到聪明复盘
2025-10-23 17:10:54
Meta削减人工智能部门约600个职位,精简架构以加速组织转型
2025-10-23 02:55:30
刚拿诺奖就登Nature封面!谷歌“量子回声”算法计算提速13000倍,可重复验证结果
2025-10-22 23:53:36
三星在电视端首发 Perplexity AI 应用程序,带来更具创新性 AI 体验
2025-10-23 10:05:39
阿里回应“C计划”爆料 夸克上线对话助手挑战豆包 AI App下一步如何进化?
2025-10-23 14:06:33
新研究揭穿Claude底裤,马斯克盖棺定论
2025-10-23 15:05:55
阿里夸克AI眼镜24日开启预售 3699元起
2025-10-23 19:13:38
512 文章
245812 浏览
24小时热文
更多

-
2025-10-24 05:23:38
-
2025-10-24 03:21:23
-
2025-10-24 01:20:07