1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

10月16日,华为宣布盘古Ultra-MoE-718B-V1.1大模型正式开源,模型权重与技术细节全面公开,可在GitCode平台下载。该模型基于昇腾NPU训练,总参数规模达718B,激活参数量为39B,融合“快思考”与“慢思考”能力,支持多轮工具调用和模式切换。相比V1.0版本,V1.1在幻觉控制、工具调用及综合性能上显著提升,幻觉率从10.11%降至3.85%,并新增Int8量化版本,显存占用减少一半,吞吐提升20%。此前,该模型在SuperCLUE榜单中位列开源模型第三,尤其在数学推理、代码生成等领域表现优异。硬件需Atlas 800T A2(≥32卡)支持。官方地址已公布。

原文链接
本文链接:https://kx.umi6.com/article/26787.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
DeepSeek 丢了开源第一王座,但继任者“Kimi K2”依然来自中国
2025-07-18 18:42:56
百元级硬件流畅运行百亿参数大模型!上交&本智激活开源端侧原生大模型
2025-07-27 18:00:02
英伟达发布“行业最高效”Nemotron 3 开源 AI 模型系列,吞吐量达上一代 4 倍
2025-12-15 23:04:58
中国AI开源模型下载量占比首次超过美国
2025-11-27 18:49:55
华为盘古 Ultra-MoE-718B-V1.1 正式开源并开放下载,模型权重与技术细节全面公开
2025-10-16 17:57:55
95后小伙手搓AI眼镜:盲道、红绿灯都可认出 成本仅百元
2025-10-24 12:39:22
过去一年,中国AI如何改变全球开源格局?
2026-01-22 13:56:28
一周六连发!昆仑万维将多模态AI卷到了新高度
2025-08-17 18:38:51
OpenAI再次推迟发布开源模型
2025-07-14 08:16:03
倪光南院士:报告显示 80% 的美国 AI 创新企业使用中国开源模型
2025-11-14 11:53:25
对话朱啸虎:搬离中国,假装不是中国AI创业公司,是没有用的
2025-09-20 20:35:10
手机也能跑大模型,腾讯混元推出多款小尺寸开源模型
2025-08-04 17:00:39
深夜突袭,阿里Qwen3登顶全球开源王座!暴击DeepSeek-R1,2小时狂揽17k星
2025-05-05 09:42:37
24小时热文
更多
扫一扫体验小程序