1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

华为近日开源了超大规模MoE推理项目Omni-Infer,为解决大模型推理的高效与稳定问题提供了标准答案。该项目面向企业用户,提供PD分离部署方案、QPM系统级优化及商用硬件使用方法论,同时推动开发者社区发展。北京智源研究院、上海人工智能实验室和OpenI启智社区均表示支持,并期待生态合作。Omni-Infer由推理框架和加速套件组成,兼容主流框架如vLLM,具备智能调度、负载均衡、MoE优化等特性,提升推理效率。目前仅支持CloudMatrix384推理卡和Linux环境,通过Docker镜像安装,开箱即用。Omni-Infer还建立了专业开源社区,开放治理、会议、活动等信息,采用两级管理机制,主动适配国内开源项目,推动多方共赢。相关资源链接已公布,包括技术报告、代码仓库及社区页面。

原文链接
本文链接:https://kx.umi6.com/article/21012.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
中国AI芯片市场迎巨变:英伟达2026年将仅占8%
2025-12-05 12:26:55
泰国政府携手华为发展人工智能
2025-05-29 21:40:42
南钢集团联合华为发布“元冶・钢铁大模型”,实现全流程、全产业链数据贯通与智能升级
2025-06-24 00:30:19
华为全球悬赏300万元解决AI时代的存储难题
2025-12-26 18:58:07
郭平:华为要成为世界AI算力的第二选择或另一个选择!目标比肩美国
2025-08-31 13:03:00
华为发布三款AI SSD系列新品:最高245TB 随机写高达1500K IOPS
2025-08-27 18:07:34
破产企业变身科技新贵,千里科技要当车界“第二个华为”?
2025-06-29 16:32:14
中国AI耳机TOP10出炉:华为第二 第一你可能没听过
2025-08-23 20:05:41
2秒吃透一道高数大题!华为揭秘7180亿参数昇腾大模型
2025-05-30 13:50:18
华为发布全新鸿蒙智能体
2025-06-20 16:01:30
传华为计划重新设计AI芯片:ASIC转向GPGPU 正面硬罡NVIDIA
2025-07-12 13:53:16
华为即将发布AI推理领域突破性成果:或能降低对HBM内存依赖
2025-08-10 10:45:55
华为徐直军:明年Q1推出昇腾950PR芯片
2025-09-18 10:51:05
24小时热文
更多
扫一扫体验小程序