2025年9月29日,DeepSeek-V3.2-Exp模型正式发布并开源,引入稀疏Attention架构以降低资源消耗、提升推理效率。华为云迅速完成适配,支持最长160K上下文序列,并将模型上架其大模型即服务平台MaaS,提供体验与API服务。华为云ModelArts推理平台基于CloudMatrix384基础设施,采用大EP并行方案优化部署,兼顾时延与吞吐性能,按需分配算力资源。用户可访问华为云官网,通过“大模型”导航菜单体验DeepSeek-V3.2-Exp模型的卓越能力。
原文链接
本文链接:https://kx.umi6.com/article/26095.html
转载请注明文章出处
相关推荐
换一换
华为云CloudMatrix384超节点AI Token服务全面上线
2025-09-19 11:16:25
华为张修征:今年上半年 CloudMatrix 384 超节点将有数万规模上线,有望“彻底终结算力焦虑”
2025-04-11 20:04:44
华为云再掀算力风暴:CloudMatrix384超节点将升级,Tokens服务性能最大可超H20四倍
2025-09-19 13:12:27
华为云又一数据中心开服:让算力像水电一样通用,青岛这步棋走对了
2024-12-07 13:46:12
“清华系”面壁智能与华为云合作,推进大模型端云协同解决方案
2024-06-24 19:56:46
华为云代码智能体开启万人公测
2026-02-11 16:33:58
华为云发布盘古大模型 5.5:自然语言处理等五大基础模型全面升级
2025-06-20 17:03:08
DeepSeek-V3.2-Exp API价格官宣大幅下调
2025-09-29 19:17:29
华为云整体算力规模较去年同期增长率接近 250%,昇腾 AI 云服务客户从 321 家增长至 1714 家
2025-08-29 00:30:09
DeepSeek-V3.2-Exp发布并开源
2025-09-29 18:14:47
华为云CEO周跃峰:要避免AI成为“泡沫” 必须要提升行业生产力
2025-12-30 18:33:12
华为云回应组织架构调整:将更多资源投入到AI产业和算力产业上
2025-08-25 17:33:58
独家|华为联合软通动力、道和通泰等探索具身智能落地
2025-06-23 10:30:40
639 文章
452107 浏览
24小时热文
更多
-
2026-03-09 21:13:27 -
2026-03-09 20:09:26 -
2026-03-09 20:09:18