华为近日开源了超大规模MoE推理项目Omni-Infer,为解决大模型推理的高效与稳定问题提供了标准答案。该项目面向企业用户,提供PD分离部署方案、QPM系统级优化及商用硬件使用方法论,同时推动开发者社区发展。北京智源研究院、上海人工智能实验室和OpenI启智社区均表示支持,并期待生态合作。Omni-Infer由推理框架和加速套件组成,兼容主流框架如vLLM,具备智能调度、负载均衡、MoE优化等特性,提升推理效率。目前仅支持CloudMatrix384推理卡和Linux环境,通过Docker镜像安装,开箱即用。Omni-Infer还建立了专业开源社区,开放治理、会议、活动等信息,采用两级管理机制,主动适配国内开源项目,推动多方共赢。相关资源链接已公布,包括技术报告、代码仓库及社区页面。
原文链接
本文链接:https://kx.umi6.com/article/21012.html
转载请注明文章出处
相关推荐
换一换
华为启动全球教育医疗伙伴联盟,倡议推动 AI 诊疗商业模式落地
2025-07-10 23:28:33
英伟达黄仁勋称华为是全球最强科技公司之一,中美在 AI 发展领域的水平非常接近
2025-05-01 16:29:14
华为发布AI数据湖解决方案,助力企业加速拥抱AI
2025-05-14 12:12:54
华为汪涛:到2030年全球将有近百亿个人AI Agent
2025-06-19 11:48:42
每2秒吃透一道高数大题!华为终于揭秘准万亿MoE昇腾训练系统全流程
2025-05-30 16:54:34
华为鸿蒙电脑:一台非Windows 国产电脑的诞生
2025-05-08 20:40:32
华为汪涛:预计 2030 年全球将有近 30 亿 AI 机器人进入工厂、家庭
2025-06-19 09:44:32
华为即将发布AI推理领域突破性成果
2025-08-10 09:43:16
华为发布AI推理技术UCM:降低HBM依赖 计划9月正式开源
2025-08-13 08:39:18
华为宣布开源盘古 7B 稠密和 72B 混合专家模型
2025-06-30 09:40:01
华为开源 SINQ AI 量化技术:显存占用最高削减 70%,单张 RTX 4090 能干 A100 的活
2025-10-06 08:32:49
黄仁勋:任何轻视华为和中国制造的人都极其天真
2025-07-16 17:11:28
中国最强科技公司!黄仁勋为何又力挺华为:计算、网络技术等强到可怕
2025-05-02 08:54:03
528 文章
259598 浏览
24小时热文
更多
-
2025-10-24 09:34:47 -
2025-10-24 09:33:43 -
2025-10-24 09:32:35