
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
8月12日,华为发布AI推理创新技术UCM(推理记忆数据管理器),该技术以KV Cache为中心,融合多类型缓存加速算法工具,分级管理推理过程中产生的记忆数据,可扩大上下文窗口,实现高吞吐、低时延的推理体验,并降低每Token推理成本。目前,UCM已在中国银联“客户之声”“营销策划”“办公助手”三大业务场景中试点应用并取得成果。华为计划于2025年9月将UCM开源,首发于魔擎社区,后续逐步贡献给主流推理引擎社区及Share Everything存储厂商和生态伙伴。
原文链接
华为于8月12日正式发布AI推理创新技术UCM(推理记忆数据管理器),该技术以KV Cache为核心,融合多类型缓存加速算法工具,分级管理推理过程中的KV Cache数据,显著提升推理效率并降低成本。UCM可扩大上下文窗口,实现高吞吐、低时延的推理体验。根据计划,华为将于2025年9月在魔擎社区开源UCM,并逐步贡献给业界主流推理引擎社区及Share Everything存储厂商与生态伙伴,推动行业技术共享与发展。(财联社)
原文链接
加载更多

暂无内容