9月29日,DeepSeek正式发布实验性模型DeepSeek-V3.2-Exp,并在Huggingface与魔搭平台开源。该版本引入DeepSeek Sparse Attention(DSA)稀疏注意力机制,优化长文本训练和推理效率,同时保持模型输出效果几乎不变。官方将V3.2-Exp与前代V3.1-Terminus的训练设置严格对齐,表现基本持平。本次更新还大幅降低API调用成本,开发者使用费用减少50%以上。目前,官方App、网页端及小程序均已同步更新至新版本。为支持对比测试,V3.1-Terminus的API接口暂时保留。论文及相关资源已公开。
原文链接
本文链接:https://kx.umi6.com/article/26080.html
转载请注明文章出处
相关推荐
换一换
DeepSeek-V3.2-Exp发布并开源
2025-09-29 18:14:47
华为昇腾、寒武纪、海光信息适配DeepSeek最新模型
2025-09-30 09:26:21
智谱GLM-5技术全公开!完全适配华为等国产芯片,美国网友酸了
2026-02-23 15:59:51
月之暗面 MoBA 核心作者自述:一个 “新晋大模型训练师” 的三入思过崖
2025-02-21 14:53:27
DeepSeek新发布
2025-09-29 22:15:21
华为昇腾 0Day 支持 DeepSeek-V3.2-Exp,面向开发者开源所有推理代码和算子实现
2025-09-29 20:14:51
DeepSeek新发布
2025-09-29 22:15:21
DeepSeek-V4-Pro API永久降价 调整为原定价的1/4
2026-05-23 15:46:56
DeepSeek 再放降本大招:NSA 官宣发布,加速推理降低成本,并且不牺牲性能
2025-02-18 17:24:09
九章云极率先完成DeepSeek-V3.2-Exp适配,提供安全高效部署方案
2025-09-30 16:29:13
DeepSeek-V3.2-Exp API价格官宣大幅下调
2025-09-29 19:17:29
DeepSeek新模型上线
2025-09-30 11:25:43
寒武纪Day 0适配DeepSeek-V3.2-Exp 同步开源推理引擎vLLM-MLU
2025-09-29 21:16:07
787 文章
714942 浏览
24小时热文
更多
-
2026-06-09 00:53:08 -
2026-06-08 23:49:41 -
2026-06-08 21:46:02