2025年9月29日,DeepSeek发布最新模型DeepSeek-V3.2-Exp,引入全新稀疏注意力机制DSA,显著提升长文本处理效率与推理性能。官方同步开源TileLang和CUDA双版本GPU算子,并推出API 5折优惠活动。新模型基于上周发布的V3.1-Terminus改进,在稳定性及工具调用能力上进一步优化,尤其在128K长上下文推理中成本更低。此外,智谱AI的GLM-4.6模型也在开发中,其官网已将GLM-4.5标记为‘上一代旗舰’。国庆期间将迎来一波AI技术更新热潮,开发者可关注相关资源链接获取更多信息。
原文链接
本文链接:https://kx.umi6.com/article/26079.html
转载请注明文章出处
相关推荐
.png)
换一换
DeepSeek开源新版R1 媲美OpenAI最高o3模型
2025-05-29 05:51:14
半年不到 DeepSeek真已跌落神坛吗!我看未必 深扒背后原因
2025-07-24 13:06:29
DeepSeek给中国软件埋了一个「地雷」?
2025-06-24 09:14:11
调查 | 爆火仅半年,DeepSeek在银行业已“泯然众模型”?三大障碍成为拦路虎
2025-08-04 11:56:14
DeepSeek核心高管离职创业,瞄准Agent赛道|独家
2025-06-09 16:30:51
华为 + DeepSeek 推理性能创新高,技术报告公布
2025-05-19 14:19:50
Transformer作者:DeepSeek才有搞头,OpenAI指望不上了
2025-09-12 11:09:05
DeepSeek式的AI味,越来越让人受不了了
2025-06-30 16:43:50
DeepSeek崩上热搜 内部人员回应:正在处理中,请稍后尝试
2025-05-13 18:58:41
DeepSeek催化下,芯片带领沪指突破3800点
2025-08-22 20:52:41
斯坦福临床医疗AI横评,DeepSeek把谷歌OpenAI都秒了
2025-06-03 17:01:06
(更新:对话功能恢复正常)DeepSeek 出现服务问题,登录失败、无法对话
2025-05-13 18:55:32
DeepSeek 开源新模型 V3.1:约 685B 参数,上下文长度拓展至 128K
2025-08-20 10:11:16
506 文章
244126 浏览
24小时热文
更多

-
2025-09-29 20:15:06
-
2025-09-29 20:14:51
-
2025-09-29 20:13:53