IBM于10月2日推出Granite 4.0系列企业级LLM模型,采用Mamba-Transformer混合架构,显著降低内存需求与推理部署成本。首发型号包括Small、Tiny、Micro等规格,未来更多版本预计在2025年底发布。该系列最小模型Granite-4.0-H-Micro参数仅3B,而Granite-4.0-H-Small以32B总参数实现开源模型一流性能。混合架构在长输入和多并发场景下减少70%内存需求,且性能优于上一代Granite 3.3 8B。IBM以Apache 2.0许可开源该系列模型,并提供ISO 42001认证及加密签名支持。
原文链接
本文链接:https://kx.umi6.com/article/26265.html
转载请注明文章出处
相关推荐
换一换
IBM 全新光学技术可缩短 GPU 闲置时间,大幅加快 AI 模型训练速度
2024-12-11 09:23:39
边看网球边猜胜率,IBM 为温网推出 AI 聊天助手及结果预测功能
2025-06-23 20:28:21
独家对话IBM陈旭东:DeepSeek很热,但影响尚未全面到来
2025-06-17 18:27:52
AI带领蓝色巨人前进!IBM财报好于预期 盘后一度涨近5%
2024-07-25 11:52:54
2025开年重磅人事变动!IBM原全球副总裁、大中华区首席技术官谢东加盟AI国企北电数智
2025-01-02 12:13:32
IBM 推出生成式 AI 网络安全助手
2024-08-13 11:10:52
联想集团携手IBM共同打造人工智能解决方案
2025-02-11 23:11:46
IBM CEO:DeepSeek 证明我们是正确的,小型且高效的模型同样能有实际成果
2025-02-07 08:48:17
IBM 首席执行官:AI 已取代数百名人力资源员工
2025-05-07 15:10:08
IBM 宣布 AI 推理加速器 Spyre 本季度正式商业可用
2025-10-09 09:11:29
IBM CEO:以现有成本建设AI数据中心“几乎不可能回本”
2025-12-02 21:37:56
Anthropic一篇博客,IBM大跌13%,创25年来最大单日跌幅
2026-02-26 12:52:01
DeepSeek V3.1发布后,投资者该思考这四个问题
2025-08-21 09:26:48
653 文章
484720 浏览
24小时热文
更多
-
2026-03-09 21:13:27 -
2026-03-09 20:09:26 -
2026-03-09 20:09:18