1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

华为近日开源了超大规模MoE推理项目Omni-Infer,为解决大模型推理的高效与稳定问题提供了标准答案。该项目面向企业用户,提供PD分离部署方案、QPM系统级优化及商用硬件使用方法论,同时推动开发者社区发展。北京智源研究院、上海人工智能实验室和OpenI启智社区均表示支持,并期待生态合作。Omni-Infer由推理框架和加速套件组成,兼容主流框架如vLLM,具备智能调度、负载均衡、MoE优化等特性,提升推理效率。目前仅支持CloudMatrix384推理卡和Linux环境,通过Docker镜像安装,开箱即用。Omni-Infer还建立了专业开源社区,开放治理、会议、活动等信息,采用两级管理机制,主动适配国内开源项目,推动多方共赢。相关资源链接已公布,包括技术报告、代码仓库及社区页面。

原文链接
本文链接:https://kx.umi6.com/article/21012.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
华为启动全球教育医疗伙伴联盟,倡议推动 AI 诊疗商业模式落地
2025-07-10 23:28:33
华为首次线下展出昇腾 384 超节点:业界最大规模 384 卡高速总线互联
2025-07-26 16:43:24
华为宣布CANN全面开源开放
2025-08-06 13:32:25
华为与深交所联合发布证券行业法规大模型,问答准确率超 90%
2025-11-28 20:47:40
昇腾384超节点真机将亮相WAIC2025
2025-07-18 10:38:43
华为发布业界首个扩散语言模型Agent,部分场景提速8倍!
2026-02-10 16:22:31
华为董事杨超斌:液冷机房正成为AI数据中心的必然选择
2025-09-17 19:35:38
余承东被任命为华为公司IRB主任
2025-09-29 21:15:03
华为发布新一代绿色AI站点和GW级AIDC解决方案
2026-03-03 08:46:51
华为 × 崖州湾国家实验室发布“繁 | 未来农业智能枢纽”:AI 有望让育种流程效率提升 30%
2025-11-11 21:29:02
开源欧拉操作系统装机量年底将超过1600万台
2025-11-14 14:03:13
华为 × 云南交投发布“绿美通道・交通大模型”,实现通用与智能算力融合升级
2025-07-16 07:56:47
华为的「荣耀」
2025-10-30 15:47:28
24小时热文
更多
扫一扫体验小程序