12月1日,DeepSeek发布两款新模型——DeepSeek V3.2和DeepSeek-V3.2-Speciale。前者性能与GPT-5相当,后者更在多项基准测试中追平闭源模型天花板Gemini,并在IMO 2025、CMO 2025等竞赛中斩获金牌。此次更新通过稀疏注意力(DSA)优化长文本处理能力,显著降低计算成本,同时强化后训练阶段投入超10%总算力提升模型表现。此外,DeepSeek优化了工具调用逻辑,改进Agent能力,并推出支持深度思考的特殊版本Speciale。尽管其Token消耗量较高,但价格仅为Gemini的1/20,性价比突出。DeepSeek持续以算法创新缩小开源与闭源模型差距,展现技术巧思。
原文链接
本文链接:https://kx.umi6.com/article/29549.html
转载请注明文章出处
相关推荐
换一换
DeepSeek新论文剧透V4新框架!用闲置网卡加速智能体推理性能
2026-02-27 16:53:38
DeepSeek发布两款新模型
2025-12-01 19:31:03
六大AI大模型展开美股投资竞赛:重仓英伟达的Deepseek再次领跑
2025-10-28 18:00:23
GLM-5真够顶的:超24小时自己跑代码,700次工具调用、800次切上下文!
2026-02-14 16:26:42
MAU被豆包反超,Deepseek挤了点牙膏
2025-10-21 15:28:27
DeepSeek发布新论文提出更为高效的AI开发方法
2026-01-02 18:32:56
DeepSeek 新模型曝光:MODEL1 代码预示新架构,最快有望 2 月发布
2026-01-21 09:02:53
张亚勤谈大模型的未来:全球不超10个 且中美将各占三四个
2026-03-18 11:06:09
谷歌新发现:DeepSeek推理分裂出多重人格,左右脑互搏越来越聪明
2026-01-20 13:05:54
最强开源大模型除夕登场!397B参数千问3.5超越Gemini 3,百万Tokens低至8毛
2026-02-16 19:34:51
DeepSeek又一论文上新
2026-02-27 15:54:06
GLM-5架构曝光,智谱两日涨近60%:采用DeepSeek同款稀疏注意力
2026-02-10 16:24:51
商汤开源 SenseNova-MARS,突破多模态搜索推理天花板
2026-01-30 18:41:28
725 文章
559016 浏览
24小时热文
更多
-
2026-04-24 18:30:24 -
2026-04-24 18:29:17 -
2026-04-24 18:28:12