华为近日开源了超大规模MoE推理项目Omni-Infer,为解决大模型推理的高效与稳定问题提供了标准答案。该项目面向企业用户,提供PD分离部署方案、QPM系统级优化及商用硬件使用方法论,同时推动开发者社区发展。北京智源研究院、上海人工智能实验室和OpenI启智社区均表示支持,并期待生态合作。Omni-Infer由推理框架和加速套件组成,兼容主流框架如vLLM,具备智能调度、负载均衡、MoE优化等特性,提升推理效率。目前仅支持CloudMatrix384推理卡和Linux环境,通过Docker镜像安装,开箱即用。Omni-Infer还建立了专业开源社区,开放治理、会议、活动等信息,采用两级管理机制,主动适配国内开源项目,推动多方共赢。相关资源链接已公布,包括技术报告、代码仓库及社区页面。
原文链接
本文链接:https://kx.umi6.com/article/21012.html
转载请注明文章出处
相关推荐
.png)
换一换
华为 × 云南交投发布“绿美通道・交通大模型”,实现通用与智能算力融合升级
2025-07-16 07:56:47
每2秒吃透一道高数大题!华为终于揭秘准万亿MoE昇腾训练系统全流程
2025-05-30 16:54:34
华为组建医疗卫生军团!推动医疗大模型应用
2025-03-10 12:35:10
华为推出 DeepSeek 训 / 推超融合一体机,适配 V3&R1 及蒸馏模型
2025-02-17 10:47:33
2秒吃透一道高数大题!华为揭秘7180亿参数昇腾大模型
2025-05-30 13:50:18
华为原生鸿蒙平板MatePad Pro13.2英寸发布
2024-11-26 16:34:19
黄仁勋:中国AI市场有没有英伟达都会进步 华为一定能找到解决方案
2025-07-21 07:12:33
郭平:华为要成为世界AI算力的第二选择或另一个选择!目标比肩美国
2025-08-31 13:03:00
华为推出全球首款星闪网关路由
2024-11-26 17:35:51
华为李小龙:手机拍摄文字AI增强容易翻车 仍属业界难题
2025-01-02 01:06:26
华为突破制裁的密码,藏在“384超节点”中
2025-06-17 18:41:35
华为AI模型运行专利公布
2025-09-05 15:25:04
华为郭振兴:2025年是AI重构企业全业务启动之年
2025-03-22 18:31:29
480 文章
179694 浏览
24小时热文
更多

-
2025-09-07 21:49:50
-
2025-09-07 20:50:36
-
2025-09-07 20:49:25