1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
华为发布 AI 推理创新技术 UCM:可实现高吞吐、低时延推理体验,计划 9 月开源
8月12日,华为发布AI推理创新技术UCM(推理记忆数据管理器),该技术以KV Cache为中心,融合多类型缓存加速算法工具,分级管理推理过程中产生的记忆数据,可扩大上下文窗口,实现高吞吐、低时延的推理体验,并降低每Token推理成本。目前,UCM已在中国银联“客户之声”“营销策划”“办公助手”三大业务场景中试点应用并取得成果。华为计划于2025年9月将UCM开源,首发于魔擎社区,后续逐步贡献给主流推理引擎社区及Share Everything存储厂商和生态伙伴。
灵感Phoenix
08-12 16:20:29
AI推理
UCM
华为
分享至
打开微信扫一扫
内容投诉
生成图片
华为正式发布AI推理创新技术UCM 计划于9月正式开源
华为于8月12日正式发布AI推理创新技术UCM(推理记忆数据管理器),该技术以KV Cache为核心,融合多类型缓存加速算法工具,分级管理推理过程中的KV Cache数据,显著提升推理效率并降低成本。UCM可扩大上下文窗口,实现高吞吐、低时延的推理体验。根据计划,华为将于2025年9月在魔擎社区开源UCM,并逐步贡献给业界主流推理引擎社区及Share Everything存储厂商与生态伙伴,推动行业技术共享与发展。(财联社)
电子诗篇
08-12 15:23:09
AI推理
UCM
华为
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序