1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

11月5日,华为宣布开源其AI推理加速关键技术——UCM(Unified Cache Manager)推理记忆数据管理。该技术通过KV Cache多级缓存与推理记忆管理,结合推理框架、算力和存储的三层协同,解决长序列推理效率低和成本高的问题。UCM架构包含稀疏化模块、稀疏化KV管理器、KV Cache存储组件及UCM连接器等关键模块,具备稀疏注意力、前缀缓存等四大能力,最高可降低首Token时延90%,提升系统吞吐22倍,并扩展上下文窗口达10倍。目前,UCM已在ModelEngine社区开放源代码与技术文档,开发者可通过GitCode或Github获取资源。

原文链接
本文链接:https://kx.umi6.com/article/27844.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
腾讯混元图像3.0图生图开源,LMArena跻身全球第一梯队,开源最强
2026-01-28 17:26:24
腾讯混元3D-Omni、混元3D-Part发布并开源
2025-09-26 18:33:53
AI 推理性能大提升:华为 UCM 技术开源,系统吞吐猛增 22 倍
2025-11-05 18:16:46
中国移动“九天”通用基础大模型 3.0 发布,核心技术开源
2025-07-26 22:47:54
阶跃星辰全面开源 Step 3.5 Flash:预训练+训练框架全放出 冲上 OpenClaw Top2
2026-03-04 10:34:06
“会操作手机的 AI”,智谱开源 AI Agent 模型 AutoGLM
2025-12-09 10:29:51
阿里通义深夜炸场:全球首个端到端全模态 AI 模型 Qwen3-Omni 发布开源,文本、图像、音视频全统一
2025-09-23 10:12:45
抖音&LV-NUS开源多模态新模,以小博大刷新SOTA,8B推理比肩GPT-4o
2025-10-14 12:13:47
马斯克背叛理想
2025-08-24 22:18:31
马斯克宣布Grok-2正式开源 Grok-3也将在大概6个月内开源
2025-08-24 18:18:35
腾讯混元开源翻译模型 1.5:手机 1GB 内存即可运行,效果超越商用 API
2025-12-30 16:27:33
真如摄影、细至发丝!阿里开源新一代图像生成模型Qwen-Image
2025-12-31 21:40:29
阿里新一代模型Qwen3.5曝光
2026-02-09 13:10:49
24小时热文
更多
扫一扫体验小程序