华为近日开源了超大规模MoE推理项目Omni-Infer,为解决大模型推理的高效与稳定问题提供了标准答案。该项目面向企业用户,提供PD分离部署方案、QPM系统级优化及商用硬件使用方法论,同时推动开发者社区发展。北京智源研究院、上海人工智能实验室和OpenI启智社区均表示支持,并期待生态合作。Omni-Infer由推理框架和加速套件组成,兼容主流框架如vLLM,具备智能调度、负载均衡、MoE优化等特性,提升推理效率。目前仅支持CloudMatrix384推理卡和Linux环境,通过Docker镜像安装,开箱即用。Omni-Infer还建立了专业开源社区,开放治理、会议、活动等信息,采用两级管理机制,主动适配国内开源项目,推动多方共赢。相关资源链接已公布,包括技术报告、代码仓库及社区页面。
原文链接
本文链接:https://kx.umi6.com/article/21012.html
转载请注明文章出处
相关推荐
换一换
余承东亲自招人!华为招募全球顶尖AI人才:提供业内有竞争力的薪酬
2025-10-21 07:18:58
华为投资物理 AI:首家国产世界模型公司“极佳视界”完成新一轮亿元级 A1 轮融资
2025-11-12 13:01:59
中国AI耳机TOP10出炉:华为第二 第一你可能没听过
2025-08-23 20:05:41
时隔多年,AI芯片又是华为发布会主角了
2025-09-19 11:09:57
华为发布AI推理新技术 将于今年9月正式开源
2025-08-12 23:24:22
徐工集团董事长杨东升拜会华为公司创始人任正非
2025-11-07 09:46:31
华为董事杨超斌:液冷机房正成为AI数据中心的必然选择
2025-09-17 19:35:38
61岁退休后,华为海思创始总裁成了复旦北大清华老师
2025-10-18 14:34:04
国产手机卖到1万6!华为新旗舰,搭载麒麟9030
2025-11-25 23:10:46
华为正式发布AI推理创新技术UCM 计划于9月正式开源
2025-08-12 15:23:09
华为创造AI算力新纪录:万卡集群训练98%可用度,秒级恢复、分钟诊断
2025-06-10 13:48:32
华为发布盘古大模型5.5
2025-06-20 17:09:56
传华为计划重新设计AI芯片:ASIC转向GPGPU 正面硬罡NVIDIA
2025-07-12 13:53:16
703 文章
562003 浏览
24小时热文
更多
-
2026-04-24 23:43:31 -
2026-04-24 23:42:26 -
2026-04-24 23:41:21