2025年12月,DeepSeek发布V3.2系列开源模型,包含DeepSeek-V3.2和DeepSeek-V3.2-Speciale。前者适用于日常问答与工具调用,推理能力达GPT-5水平;后者聚焦极致推理,性能媲美Gemini-3.0-Pro,并斩获IMO、CMO、ICPC等竞赛金牌。V3.2采用DSA稀疏注意力机制,大幅降低长文本处理成本,在Agent任务中表现突出,支持思考融入工具调用。Speciale版本强化数学推理与逻辑验证,但未优化日常对话,且仅供研究使用。团队投入超预训练10%的算力用于强化学习,开发自动环境合成pipeline,生成大量复杂任务数据。尽管世界知识广度仍逊于闭源模型,DeepSeek-V3.2在多项基准测试中超越现有开源模型,展现强大泛化能力。
原文链接
本文链接:https://kx.umi6.com/article/29471.html
转载请注明文章出处
相关推荐
换一换
DeepSeek-V3.2系列开源,性能直接对标Gemini-3.0-Pro
2025-12-01 22:37:15
DeepSeekV3.2技术报告还是老外看得细
2025-12-04 09:09:55
周鸿祎:只有通过多智能体协作 才能让人工智能真正落地
2026-03-07 21:02:28
美国拟将AI芯片出口管制扩展至全球 英伟达、AMD等公司出口需获许可
2026-03-06 06:31:53
卡帕西开源Agent自进化训练框架,5分钟一轮实验,48h内揽星9.5k
2026-03-09 15:50:15
OpenClaw最强外挂出现:小龙虾抓不到数据有救了!
2026-03-08 18:27:06
周鸿祎解读AI短剧:直言有望颠覆Netflix 生产效率提升数十倍
2026-03-08 14:07:20
龙虾上桌!上市公司抢着养 OpenClaw引爆科技圈
2026-03-09 18:01:30
佛州男子过度迷恋“AI娇妻”自杀身亡 家属起诉谷歌Gemini
2026-03-07 13:35:28
企业微信宣布支持接入OpenClaw
2026-03-09 19:06:03
无锡高新区发布“养龙虾”12条 最高补贴500万
2026-03-09 14:47:52
火山引擎上线ArkClaw:开箱即用的云上SaaS版OpenClaw
2026-03-09 15:55:48
阿莱德:目前公司仅有极个别订单最终交货地位于迪拜 涉及订单金额占公司整体营收比例不足1%
2026-03-06 11:58:07
658 文章
488037 浏览
24小时热文
更多
-
2026-03-09 21:13:27 -
2026-03-09 20:09:26 -
2026-03-09 20:09:18