8月12日,华为发布AI推理创新技术UCM(推理记忆数据管理器),该技术以KV Cache为中心,融合多类型缓存加速算法工具,分级管理推理过程中产生的记忆数据,可扩大上下文窗口,实现高吞吐、低时延的推理体验,并降低每Token推理成本。目前,UCM已在中国银联“客户之声”“营销策划”“办公助手”三大业务场景中试点应用并取得成果。华为计划于2025年9月将UCM开源,首发于魔擎社区,后续逐步贡献给主流推理引擎社区及Share Everything存储厂商和生态伙伴。
原文链接
本文链接:https://kx.umi6.com/article/23437.html
转载请注明文章出处
相关推荐
换一换
华为汪涛:预计 2030 年全球将有近 30 亿 AI 机器人进入工厂、家庭
2025-06-19 09:44:32
华为发布以AI-Centric全面升级的AI WAN解决方案
2025-10-15 21:41:25
英伟达黄仁勋称华为是全球最强科技公司之一,中美在 AI 发展领域的水平非常接近
2025-05-01 16:29:14
华为发布盘古大模型5.5
2025-06-20 17:09:56
华为突破制裁的密码,藏在“384超节点”中
2025-06-17 18:41:35
华为宣布开源盘古 7B 稠密和 72B 混合专家模型
2025-06-30 09:40:01
时隔5年 任正非再次与上海交大校长会面
2025-07-23 13:51:33
值得买:与华为的合作目前已取得几项重要成果
2025-10-27 10:57:33
余承东亲自招人!华为招募全球顶尖AI人才:提供业内有竞争力的薪酬
2025-10-21 07:18:58
中国信通院联合华为、三大运营商等成立“先进存力AI推理工作组”
2025-08-26 21:53:20
AI推理利润惊人,这里挤满了英伟达的「狙击者」
2025-08-18 17:49:02
华为等头部厂商加速布局 数据库产业迎来AI革命
2025-06-25 20:51:14
华为与青岛城运控股集团签署深化合作协议
2025-04-10 20:09:03
577 文章
302258 浏览
24小时热文
更多
-
2025-11-05 21:22:18 -
2025-11-05 20:23:03 -
2025-11-05 20:21:58