华为近日开源了超大规模MoE推理项目Omni-Infer,为解决大模型推理的高效与稳定问题提供了标准答案。该项目面向企业用户,提供PD分离部署方案、QPM系统级优化及商用硬件使用方法论,同时推动开发者社区发展。北京智源研究院、上海人工智能实验室和OpenI启智社区均表示支持,并期待生态合作。Omni-Infer由推理框架和加速套件组成,兼容主流框架如vLLM,具备智能调度、负载均衡、MoE优化等特性,提升推理效率。目前仅支持CloudMatrix384推理卡和Linux环境,通过Docker镜像安装,开箱即用。Omni-Infer还建立了专业开源社区,开放治理、会议、活动等信息,采用两级管理机制,主动适配国内开源项目,推动多方共赢。相关资源链接已公布,包括技术报告、代码仓库及社区页面。
原文链接
本文链接:https://kx.umi6.com/article/21012.html
转载请注明文章出处
相关推荐
换一换
时隔5年 任正非再次与上海交大校长会面
2025-07-23 13:51:33
中国信通院联合华为、三大运营商等成立“先进存力AI推理工作组”
2025-08-26 21:53:20
NVIDIA黄仁勋:低估华为实在太愚蠢
2025-11-12 12:01:36
华为发布AI超节点服务器Atlas 850,支持128台1024卡超节点集群
2025-09-19 11:12:55
华为汪涛:预计 2030 年全球将有近 30 亿 AI 机器人进入工厂、家庭
2025-06-19 09:44:32
徐直军:华为对为人工智能发展提供充裕算力充满信心
2025-09-18 15:57:24
报告:华为2026年将占据中国AI芯片市场50%份额
2025-12-04 18:36:56
华为AI新技术揭晓!英伟达曾花50亿收购“同款”
2025-11-21 20:41:32
华为发布以AI-Centric全面升级的AI WAN解决方案
2025-10-15 21:41:25
黄仁勋:中国AI市场有没有英伟达都会进步 华为一定能找到解决方案
2025-07-21 07:12:33
华为UCM推理记忆管理技术正式开源
2025-11-05 16:17:45
华为汪涛:到2030年全球将有近百亿个人AI Agent
2025-06-19 11:48:42
华为:将向开源欧拉社区贡献支持超节点的操作系统插件代码
2025-11-14 18:10:40
660 文章
478417 浏览
24小时热文
更多
-
2026-03-10 10:03:26 -
2026-03-10 10:02:35 -
2026-03-10 09:02:22