5月2日,IBM介绍了Granite 4.0系列模型中的最小版本——Granite 4.0 Tiny的预览版。该版本具有高计算效率和低内存需求,在FP8精度下,仅需12GB显存即可支持5个128KB上下文窗口的并发对话。其硬件需求较低,适合消费级显卡如NVIDIA GeForce RTX 3060(12GB,约2383元人民币)。Granite 4.0 Tiny计划训练Token数至少为15T,当前预览版已训练2.5T,性能接近训练Token量12T的Granite 3.3 2B Instruct,并在128KB上下文窗口16并发会话下的内存需求降低约72%。该版本总参数规模为7B,实际活动参数为1B,采用混合Mamba-2/Transformer架构。预览版已在Hugging Face上以Apache 2.0许可证发布,IBM计划今年夏天正式推出Tiny、Small和Medium版本。
原文链接
本文链接:https://kx.umi6.com/article/18405.html
转载请注明文章出处
相关推荐
换一换
IBM 全新光学技术可缩短 GPU 闲置时间,大幅加快 AI 模型训练速度
2024-12-11 09:23:39
IBM 推出生成式 AI 网络安全助手
2024-08-13 11:10:52
AI带领蓝色巨人前进!IBM财报好于预期 盘后一度涨近5%
2024-07-25 11:52:54
单机即可部署运行 DeepSeek R1 671B 模型,浪潮信息推出元脑 R1 推理服务器
2025-02-12 11:25:32
IBM宣布与AMD合作
2024-11-18 22:33:09
3分钟千人被裁,IBM中国大败退
2024-08-27 00:35:41
IBM 宣布 AI 推理加速器 Spyre 本季度正式商业可用
2025-10-09 09:11:29
IBM开始调查中国区老员工举报董事长陈旭东“七宗罪”
2024-10-15 20:02:46
IBM CEO:AI 短期内不会取代程序员
2025-03-12 16:33:11
蓝色巨人IBM看空AI:8万亿美元回不了本 AGI可能性0-1%
2025-12-03 20:41:46
IBM将收购DataStax
2025-02-26 00:14:21
IBM 与推理 ASIC 芯片企业 Groq 达成合作,加速企业 AI 部署
2025-10-21 18:32:27
边看网球边猜胜率,IBM 为温网推出 AI 聊天助手及结果预测功能
2025-06-23 20:28:21
672 文章
530535 浏览
24小时热文
更多
-
2026-04-24 20:31:56 -
2026-04-24 20:29:51 -
2026-04-24 19:29:38