5月2日,IBM介绍了Granite 4.0系列模型中的最小版本——Granite 4.0 Tiny的预览版。该版本具有高计算效率和低内存需求,在FP8精度下,仅需12GB显存即可支持5个128KB上下文窗口的并发对话。其硬件需求较低,适合消费级显卡如NVIDIA GeForce RTX 3060(12GB,约2383元人民币)。Granite 4.0 Tiny计划训练Token数至少为15T,当前预览版已训练2.5T,性能接近训练Token量12T的Granite 3.3 2B Instruct,并在128KB上下文窗口16并发会话下的内存需求降低约72%。该版本总参数规模为7B,实际活动参数为1B,采用混合Mamba-2/Transformer架构。预览版已在Hugging Face上以Apache 2.0许可证发布,IBM计划今年夏天正式推出Tiny、Small和Medium版本。
原文链接
本文链接:https://kx.umi6.com/article/18405.html
转载请注明文章出处
相关推荐
换一换
IBM 推出 Granite 4.0 系列模型:混合架构降低内存需求,Apache 2.0 开源
2025-10-04 18:04:27
2025开年重磅人事变动!IBM原全球副总裁、大中华区首席技术官谢东加盟AI国企北电数智
2025-01-02 12:13:32
独家对话IBM陈旭东:DeepSeek很热,但影响尚未全面到来
2025-06-17 18:27:52
IBM宣布与AMD合作
2024-11-18 22:33:09
IBM CEO:AI 短期内不会取代程序员
2025-03-12 16:33:11
IBM发布面向企业的人工智能模型新版本
2024-10-21 15:32:24
IBM开始调查中国区老员工举报董事长陈旭东“七宗罪”
2024-10-15 20:02:46
IBM将收购DataStax
2025-02-26 00:14:21
IBM 首席执行官:AI 已取代数百名人力资源员工
2025-05-07 15:10:08
24GB!Intel锐炫B580显存要翻番 醉翁之意不在游戏
2024-12-30 01:04:46
AI带领蓝色巨人前进!IBM财报好于预期 盘后一度涨近5%
2024-07-25 11:52:54
准备和谷歌AI合作?麦当劳将终止与IBM的“得来速订餐”服务
2024-06-18 12:30:13
12GB 显存可实现 128K 上下文 5 并发会话,IBM 预览 Granite 4.0 Tiny 模型
2025-05-10 12:06:44
532 文章
252885 浏览
24小时热文
更多
-
2025-10-25 18:38:20 -
2025-10-25 18:37:15 -
2025-10-25 16:32:54