以下是原文 正文:【智谱开源文生图模型 CogView3-Plus,相关功能已上线智谱清言App】 智谱技术团队于10月14日宣布开源文生图模型CogView3及其增强版CogView3-Plus-3B,这些模型现已集成至“智谱清言”App。CogView3是一个基于级联扩散的文本转图像模型,分为三个阶段:生成低分辨率图像、进行超分辨率处理至1024x1024,最后迭代生成2048x2048高分辨率图像。在实际应用中,CogView3表现出色,人工评估得分超越当前最佳开源文本到图像扩散模型SDXL77.0%,且推理速度仅为SDXL的1/10。而CogView3-Plus在此基础上引入DiT框架,优化了性能,采用Zero-SNR扩散噪声调度和文本-图像联合注意力机制,相较于MMDiT结构,它在保持基本能力的同时,有效降低了训练和推理成本。此外,该模型使用潜在维度为16的VAE。开发者可通过以下链接获取模型:[链接1]、[链接2]、[链接3]。
原文链接
本文链接:https://kx.umi6.com/article/7340.html
转载请注明文章出处
相关推荐
.png)
换一换
智谱清言 App 视频通话功能面向所有用户限时免费开放:“有了眼睛”的 AI 产品
2024-09-06 17:07:15
智谱开源文生图模型 CogView3-Plus,相关功能上线智谱清言 App
2024-10-15 17:49:24
OpenAI今年预计通过ChatGPT实现近100亿美元收入
2025-09-06 10:33:35
AI 的下一个战场:小模型崛起
2025-09-05 21:26:34
Anthropic突然封锁中国企业,我们该从中学到什么?
2025-09-06 11:33:57
通义千问系列最强大的语言模型:Qwen3-Max-Preview 上线
2025-09-06 00:26:52
美国加州、特拉华州检察长警告 OpenAI:对伤害儿童的行为应当零容忍
2025-09-06 21:38:26
腾讯大笔资金加码AI 曝一业务关停 相关视频号已被注销 官网显示“当前服务升级维护中”
2025-09-05 12:21:09
字节Seed最新版原生智能体来了!一个模型搞定手机/电脑/浏览器自主操作
2025-09-05 13:18:29
AIDC高速互联需求不止 OCS会是下一个答案吗?
2025-09-06 08:33:16
消息称字节为 Seed 部门 AI 大模型技术员工发放期权津贴,每月最高价值 13.5 万元
2025-09-05 00:09:19
腾讯混元游戏 2.0 发布:图片秒变动画 / CG,全面开放使用
2025-09-05 17:21:54
钉钉与英特尔,共享同一种革命
2025-09-05 14:20:06
466 文章
166646 浏览
24小时热文
更多

-
2025-09-07 15:46:08
-
2025-09-07 14:45:54
-
2025-09-07 14:45:38