
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
2025年8月13日,在2025金融AI推理应用落地与发展论坛上,华为发布AI推理创新技术UCM(推理记忆数据管理器),并计划于9月正式开源。UCM通过先进的KV Cache系统和分级管理策略,显著提升推理效率,扩大上下文窗口,降低Token推理成本,缓解对HBM高带宽内存的依赖。华为将与中国银联联合展示AI推理领域最新成果,并与信通院、清华大学等专家探讨优化大模型推理的技术前沿。华为数据存储产品线副总裁樊杰强调高质量数据与存储对AI发展的重要性,称高性能存储可大幅提升算力效率。UCM技术将在魔擎社区首发,并逐步贡献给主流推理引擎社区及生态伙伴。
原文链接
加载更多

暂无内容