1月14日,智谱联合华为开源新一代多模态模型GLM-Image,这是首个在国产芯片上完成全程训练的SOTA模型。该模型基于昇腾Atlas 800T A2设备与昇思MindSpore AI框架,采用“自回归+扩散解码器”混合架构,突破知识密集型场景生成难题,如海报、科普图等。GLM-Image在文字渲染领域表现优异,尤其擅长汉字生成任务,并在CVTG-2K和LongText-Bench榜单中取得开源第一的成绩。其支持1024x1024至2048x2048多种分辨率图像生成,适用于科普插画、商业海报、社交媒体封面等复杂图文任务。模型现已开放体验与开源,API调用成本低至0.1元/张图片,速度优化版本即将发布。
原文链接
本文链接:https://kx.umi6.com/article/31588.html
转载请注明文章出处
相关推荐
换一换
DeepSeek:UE8M0 FP8是针对即将发布的下一代国产芯片设计
2025-08-21 16:42:18
空间智能版ImageNet来了!李飞飞吴佳俊团队出品
2024-11-11 16:11:01
具身智能实力派!十年多模态打底,世界模型开路,商汤悟能来了
2025-07-28 10:08:25
谷歌年度大招:所有AI模型全升级一遍!Gemini2.5大杯中杯霸榜前二,新版视频/图像模型亮相
2025-05-21 05:52:42
32B本地部署!阿里开源最新多模态模型:主打视觉语言,数学推理也很强
2025-03-25 09:39:46
阶跃星辰首届开放日:多模领先,智能终端等Agent应用全面涌现
2025-02-21 18:55:11
实测Gemini 3 Pro - ,未来已来?
2025-11-19 10:08:03
华为开源7B多模态模型,视觉定位和OCR能力出色,你的昇腾端侧“新甜点”来了
2026-01-05 14:06:30
阿里云魔搭社区:首发阶跃星辰最新开源两款多模态模型 已上架超4万个开源模型
2025-02-21 13:58:38
阿里云栖大会一口气发布千问 3-VL、万相 2.5 等六大模型 + 通义百聆新品牌,覆盖文本、视觉、语音、视频、代码、图像全场景
2025-09-24 14:42:04
全新创作平台SkyReels来了!一张画布+对话框包办AI视频创作流程
2025-11-04 13:13:09
行业首个:8B 参数面壁小钢炮 MiniCPM-V 4.5 开源,号称“最强端侧多模态模型”
2025-08-28 10:15:37
DeepSeek 深夜再放大招:7B 参数人人可用的视觉多模态模型 Janus-Pro-7B 开源
2025-01-28 01:38:40
747 文章
656039 浏览
24小时热文
更多
-
2026-06-08 23:49:41 -
2026-06-08 21:46:02 -
2026-06-08 19:42:13