2026年1月14日,智谱与华为联合发布中国首个全程基于国产芯片训练的SOTA多模态模型GLM-Image。该模型在文字渲染、图像生成等方面表现优异,尤其擅长处理复杂视觉文字生成和长文本渲染任务,并在CVTG-2K和LongText-Bench双榜单中夺得第一。GLM-Image支持1024×1024至2048×2048任意比例输出,适用于多种社交媒体平台需求。其创新采用‘自回归+扩散解码器’混合架构,结合华为Ascend A2芯片及深度优化的Mindspeed-LLM框架完成全流程训练。此外,API调用成本极低,单张图片生成仅需0.1元,为行业提供高性价比解决方案。项目已开源,可通过GitHub、Hugging Face等平台获取。
原文链接
本文链接:https://kx.umi6.com/article/31616.html
转载请注明文章出处
相关推荐
换一换
DeepSeek 深夜再放大招:7B 参数人人可用的视觉多模态模型 Janus-Pro-7B 开源
2025-01-28 01:38:40
Kimi最新多模态模型K2-VL提前现身
2026-01-05 15:13:56
多模态模型学会“按需搜索”,少搜30%还更准!字节&NTU新研究优化多模态模型搜索策略
2025-07-09 14:06:26
vivo发布端侧多模态模型,只有3B可理解GUI界面,20项评测表现亮眼
2025-07-10 17:25:30
百度AI芯片公司冲刺IPO:出货量国产第二
2026-01-03 15:15:25
AI科学家能不能理解普通人对AI的需求,怎么理解?
2024-10-09 10:59:30
Meta开源多模态模型——Llama 3.2
2024-10-09 11:34:43
全新创作平台SkyReels来了!一张画布+对话框包办AI视频创作流程
2025-11-04 13:13:09
阶跃生态开放日:聚焦智能终端 Agent,率先布局端侧全产业
2025-02-25 17:06:04
行业首个:商汤发布并开源 NEO 原生多模态模型架构,实现视觉、语言深层统一
2025-12-02 23:39:14
32B本地部署!阿里开源最新多模态模型:主打视觉语言,数学推理也很强
2025-03-25 09:39:46
多模态模型挑战北京杭州地铁图!o3成绩显著,但跟人类有差距
2025-06-07 13:49:19
上交大冷静文:模型发展需要和芯片、系统厂商协同
2025-04-30 20:26:59
730 文章
488946 浏览
24小时热文
更多
-
2026-03-09 21:13:27 -
2026-03-09 20:09:26 -
2026-03-09 20:09:18