以下是原文 正文:【智谱开源文生图模型 CogView3-Plus,相关功能已上线智谱清言App】 智谱技术团队于10月14日宣布开源文生图模型CogView3及其增强版CogView3-Plus-3B,这些模型现已集成至“智谱清言”App。CogView3是一个基于级联扩散的文本转图像模型,分为三个阶段:生成低分辨率图像、进行超分辨率处理至1024x1024,最后迭代生成2048x2048高分辨率图像。在实际应用中,CogView3表现出色,人工评估得分超越当前最佳开源文本到图像扩散模型SDXL77.0%,且推理速度仅为SDXL的1/10。而CogView3-Plus在此基础上引入DiT框架,优化了性能,采用Zero-SNR扩散噪声调度和文本-图像联合注意力机制,相较于MMDiT结构,它在保持基本能力的同时,有效降低了训练和推理成本。此外,该模型使用潜在维度为16的VAE。开发者可通过以下链接获取模型:[链接1]、[链接2]、[链接3]。
原文链接
本文链接:https://kx.umi6.com/article/7340.html
转载请注明文章出处
相关推荐
换一换
智谱开源文生图模型 CogView3-Plus,相关功能上线智谱清言 App
2024-10-15 17:49:24
智谱清言 App 视频通话功能面向所有用户限时免费开放:“有了眼睛”的 AI 产品
2024-09-06 17:07:15
Anthropic下调其利润率预期
2026-01-22 11:52:20
OpenAI 回应 ChatGPT 出现广告:平台 95% 是免费用户,会坚守一些原则
2026-01-21 13:13:21
苹果首款AI穿戴设备最早可能在2027年发布
2026-01-22 18:06:16
Node.js之父:手写代码已死
2026-01-22 14:57:11
头号重仓股易主 公募持续掘金AI主线
2026-01-23 06:34:26
超600家上市公司预告2025年业绩 新兴产业增势亮眼
2026-01-22 06:40:59
中国政府只在特殊情况下批准购买H200芯片?商务部回应
2026-01-22 16:03:57
千问系列模型下载量突破10亿次
2026-01-21 12:07:14
34GB大礼包 AMD显卡AI生产力来了:ComfyUI等5大软件一键部署
2026-01-22 23:17:29
中国团队首次在Nature子刊发布医疗AI标准,未来医生MedGPT摘得全球桂冠
2026-01-21 13:06:32
阿联酋人工智能公司G42:未来几年内将数据中心总容量提升至5吉瓦
2026-01-21 17:23:33
616 文章
416029 浏览
24小时热文
更多
-
2026-01-23 06:34:26 -
2026-01-23 00:20:44 -
2026-01-22 23:18:34