9月29日,DeepSeek-V3.2-Exp模型在Hugging Face平台正式发布并开源。该模型采用稀疏Attention架构,显著降低计算资源消耗,同时提升推理效率。目前,华为云已完成对该模型的适配,支持最大160K长序列上下文长度。这一进展为大模型应用提供了更高性能和灵活性。(记者 黄心怡)
原文链接
本文链接:https://kx.umi6.com/article/26078.html
转载请注明文章出处
相关推荐
换一换
爱尔眼科与华为云签署战略合作协议
2025-06-28 21:23:34
华为云回应组织架构调整:将更多资源投入到AI产业和算力产业上
2025-08-25 17:33:58
华为云CEO周跃峰:下半年将发布一系列面向行业和产品化的“龙虾”
2026-03-20 11:26:18
DeepSeek-V3.2-Exp 模型正式发布并开源,API 大幅降价
2025-09-29 19:14:08
华为云:做厚算力“黑土地”,成就行业AI先锋
2025-09-22 08:54:15
九章云极率先完成DeepSeek-V3.2-Exp适配,提供安全高效部署方案
2025-09-30 16:29:13
华为云董理斌:盘古西语及葡语NLP大模型将于Q3发布
2025-05-20 21:47:31
DeepSeek-V3.2-Exp官宣发布,API价格下调超50%
2025-09-29 20:15:06
昇腾云客户2663家,华为云稳居最大国产AI云服务提供商
2026-01-22 17:01:32
DeepSeek-V3.2-Exp第一时间上线华为云
2025-09-30 00:16:10
最高300Pflops算力,超越”同行”67%!一文看懂华为云CloudMartix 384
2025-05-19 09:09:29
曝华为云架构调整:裁撤整合多个部门 专注AI领域 目标今年盈利
2025-08-23 16:02:39
云鼎科技与华为云举行化工工艺优化解决方案合作签约仪式
2024-12-07 20:54:13
740 文章
559467 浏览
24小时热文
更多
-
2026-04-24 18:31:29 -
2026-04-24 18:30:24 -
2026-04-24 18:29:17