DeepSeek-V3.2系列开源，性能直接对标Gemini-3.0-Pro

2025-12-01 22:37:15

智慧轨迹

发布在

快讯

阅读：1780

2025年12月，DeepSeek发布V3.2系列开源模型，包含DeepSeek-V3.2和DeepSeek-V3.2-Speciale。前者适用于日常问答与工具调用，推理能力达GPT-5水平；后者聚焦极致推理，性能媲美Gemini-3.0-Pro，并斩获IMO、CMO、ICPC等竞赛金牌。V3.2采用DSA稀疏注意力机制，大幅降低长文本处理成本，在Agent任务中表现突出，支持思考融入工具调用。Speciale版本强化数学推理与逻辑验证，但未优化日常对话，且仅供研究使用。团队投入超预训练10%的算力用于强化学习，开发自动环境合成pipeline，生成大量复杂任务数据。尽管世界知识广度仍逊于闭源模型，DeepSeek-V3.2在多项基准测试中超越现有开源模型，展现强大泛化能力。

原文链接

本文链接：https://kx.umi6.com/article/29471.html

转载请注明文章出处

Agent任务