IBM于10月2日推出Granite 4.0系列企业级LLM模型,采用Mamba-Transformer混合架构,显著降低内存需求与推理部署成本。首发型号包括Small、Tiny、Micro等规格,未来更多版本预计在2025年底发布。该系列最小模型Granite-4.0-H-Micro参数仅3B,而Granite-4.0-H-Small以32B总参数实现开源模型一流性能。混合架构在长输入和多并发场景下减少70%内存需求,且性能优于上一代Granite 3.3 8B。IBM以Apache 2.0许可开源该系列模型,并提供ISO 42001认证及加密签名支持。
原文链接
本文链接:https://kx.umi6.com/article/26265.html
转载请注明文章出处
相关推荐
换一换
准备和谷歌AI合作?麦当劳将终止与IBM的“得来速订餐”服务
2024-06-18 12:30:13
12GB 显存可实现 128K 上下文 5 并发会话,IBM 预览 Granite 4.0 Tiny 模型
2025-05-10 12:06:44
2025开年重磅人事变动!IBM原全球副总裁、大中华区首席技术官谢东加盟AI国企北电数智
2025-01-02 12:13:32
IBM 企业级 AI 开发平台 watsonx.ai 上线 DeepSeek R1 蒸馏模型
2025-02-11 13:51:49
IBM将以93亿美元收购Confluent以拓展人工智能服务
2025-12-09 04:10:33
IBM 发布轻量级视觉语言 AI 模型 Granite-Docling-258M:用于文件转换、支持中文
2025-09-20 20:33:22
IBM开始调查中国区老员工举报董事长陈旭东“七宗罪”
2024-10-15 20:02:46
豪掷110亿美元!IBM收购数据基础设施公司Confluent
2025-12-09 09:23:55
联想集团携手IBM共同打造人工智能解决方案
2025-02-11 23:11:46
IBM 与推理 ASIC 芯片企业 Groq 达成合作,加速企业 AI 部署
2025-10-21 18:32:27
IBM宣布与AMD合作
2024-11-18 22:33:09
IBM 推出生成式 AI 网络安全助手
2024-08-13 11:10:52
独家对话IBM陈旭东:DeepSeek很热,但影响尚未全面到来
2025-06-17 18:27:52
626 文章
438114 浏览
24小时热文
更多
-
2026-01-23 09:43:53 -
2026-01-23 08:40:41 -
2026-01-23 06:34:26