1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

华为近日开源了超大规模MoE推理项目Omni-Infer,为解决大模型推理的高效与稳定问题提供了标准答案。该项目面向企业用户,提供PD分离部署方案、QPM系统级优化及商用硬件使用方法论,同时推动开发者社区发展。北京智源研究院、上海人工智能实验室和OpenI启智社区均表示支持,并期待生态合作。Omni-Infer由推理框架和加速套件组成,兼容主流框架如vLLM,具备智能调度、负载均衡、MoE优化等特性,提升推理效率。目前仅支持CloudMatrix384推理卡和Linux环境,通过Docker镜像安装,开箱即用。Omni-Infer还建立了专业开源社区,开放治理、会议、活动等信息,采用两级管理机制,主动适配国内开源项目,推动多方共赢。相关资源链接已公布,包括技术报告、代码仓库及社区页面。

原文链接
本文链接:https://kx.umi6.com/article/21012.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
华为发布三款AI SSD系列新品:最高245TB 随机写高达1500K IOPS
2025-08-27 18:07:34
华为郭振兴:2025年是AI重构企业全业务启动之年
2025-03-22 18:31:29
华为AI模型运行专利公布
2025-09-05 15:25:04
华为徐直军:全球最强超节点今年四季度上市
2025-09-18 10:51:41
华为徐直军:明年Q1推出昇腾950PR芯片
2025-09-18 10:51:05
昇腾384超节点真机将亮相WAIC2025
2025-07-18 10:38:43
华为、浙大发布 DeepSeek-R1-Safe 基础大模型:基于昇腾千卡算力平台,破解 AI“安全与性能”难题
2025-09-21 12:44:49
报告:华为2026年将占据中国AI芯片市场50%份额
2025-12-04 18:36:56
余承东亲自招人!华为招募全球顶尖AI人才:提供业内有竞争力的薪酬
2025-10-21 07:18:58
值得买:与华为的合作目前已取得几项重要成果
2025-10-27 10:57:33
华为鸿蒙电脑:一台非Windows 国产电脑的诞生
2025-05-08 20:40:32
华为突破制裁的密码,藏在“384超节点”中
2025-06-17 18:41:35
华为模型交互专利公布
2025-09-23 17:25:39
24小时热文
更多
扫一扫体验小程序