2025年12月,DeepSeek发布V3.2系列开源模型,包含DeepSeek-V3.2和DeepSeek-V3.2-Speciale。前者适用于日常问答与工具调用,推理能力达GPT-5水平;后者聚焦极致推理,性能媲美Gemini-3.0-Pro,并斩获IMO、CMO、ICPC等竞赛金牌。V3.2采用DSA稀疏注意力机制,大幅降低长文本处理成本,在Agent任务中表现突出,支持思考融入工具调用。Speciale版本强化数学推理与逻辑验证,但未优化日常对话,且仅供研究使用。团队投入超预训练10%的算力用于强化学习,开发自动环境合成pipeline,生成大量复杂任务数据。尽管世界知识广度仍逊于闭源模型,DeepSeek-V3.2在多项基准测试中超越现有开源模型,展现强大泛化能力。
原文链接
本文链接:https://kx.umi6.com/article/29471.html
转载请注明文章出处
相关推荐
换一换
DeepSeekV3.2技术报告还是老外看得细
2025-12-04 09:09:55
DeepSeek-V3.2系列开源,性能直接对标Gemini-3.0-Pro
2025-12-01 22:37:15
OpenAI已建立人形机器人实验室 启动以来规模扩大四倍多
2026-01-22 21:11:56
“格陵兰纷争”冲击美股 知名分析师建议趁机买入AI科技股
2026-01-21 15:19:59
黄仁勋:AI时代蓝领更吃香 水管工、电工能拿六位数薪水
2026-01-22 07:42:15
深圳芯片「夫妻店」赴港IPO
2026-01-21 15:14:19
商务部等9部门:推动药品零售企业监管向服务型监管、预防型监管、数智化治理转变
2026-01-22 17:04:48
中国政府只在特殊情况下批准购买H200芯片?商务部回应
2026-01-22 16:03:57
成立两年半登顶全球AI创作社区,背后是中国团队在“卖情绪”??
2026-01-22 20:08:53
最新调仓路径显现 基金经理关注确定性与安全边际
2026-01-22 07:43:21
大学开始用AI招生了
2026-01-22 15:58:41
美国AI财大气粗 国产AI学不了:Kimi仅用了1%算力就超越主流闭源
2026-01-22 22:14:12
阿联酋人工智能公司G42:未来几年内将数据中心总容量提升至5吉瓦
2026-01-21 17:23:33
637 文章
446116 浏览
24小时热文
更多
-
2026-01-23 00:20:44 -
2026-01-22 23:18:34 -
2026-01-22 23:17:29