IBM于10月2日推出Granite 4.0系列企业级LLM模型,采用Mamba-Transformer混合架构,显著降低内存需求与推理部署成本。首发型号包括Small、Tiny、Micro等规格,未来更多版本预计在2025年底发布。该系列最小模型Granite-4.0-H-Micro参数仅3B,而Granite-4.0-H-Small以32B总参数实现开源模型一流性能。混合架构在长输入和多并发场景下减少70%内存需求,且性能优于上一代Granite 3.3 8B。IBM以Apache 2.0许可开源该系列模型,并提供ISO 42001认证及加密签名支持。
原文链接
本文链接:https://kx.umi6.com/article/26265.html
转载请注明文章出处
相关推荐
换一换
IBM 首席执行官:AI 已取代数百名人力资源员工
2025-05-07 15:10:08
蓝色巨人IBM看空AI:8万亿美元回不了本 AGI可能性0-1%
2025-12-03 20:41:46
Anthropic一篇博客,IBM大跌13%,创25年来最大单日跌幅
2026-02-26 12:52:01
IBM CEO:AI 短期内不会取代程序员
2025-03-12 16:33:11
3分钟千人被裁,IBM中国大败退
2024-08-29 09:52:12
IBM将以93亿美元收购Confluent以拓展人工智能服务
2025-12-09 04:10:33
IBM 推出生成式 AI 网络安全助手
2024-08-13 11:10:52
IBM 与推理 ASIC 芯片企业 Groq 达成合作,加速企业 AI 部署
2025-10-21 18:32:27
豪掷110亿美元!IBM收购数据基础设施公司Confluent
2025-12-09 09:23:55
IBM CEO:以现有成本建设AI数据中心“几乎不可能回本”
2025-12-02 21:37:56
3分钟千人被裁,IBM中国大败退
2024-08-27 00:35:41
IBM 宣布 AI 推理加速器 Spyre 本季度正式商业可用
2025-10-09 09:11:29
DeepSeek V3.1发布后,投资者该思考这四个问题
2025-08-21 09:26:48
706 文章
643823 浏览
24小时热文
更多
-
2026-06-09 00:53:08 -
2026-06-08 23:49:41 -
2026-06-08 21:46:02