DeepSeek-V3.2 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

DeepSeekV3.2技术报告还是老外看得细

12月4日，DeepSeek发布两款开源模型DeepSeek-V3.2和DeepSeek-V3.2-Speciale，在硅谷引发热议。新模型在智能体评测中达到开源模型最高水平，大幅缩小与顶尖闭源模型的差距。其中，标准版性能接近GPT-5，特别版超越GPT-5并在IMO、CMO等竞赛中获金牌，媲美Gemini-3.0-Pro。研究者苟志斌指出，强化学习在长上下文长度下也能持续扩展，突破了后训练瓶颈。此外，DeepSeek-V3.2系列成本极低，比GPT-5便宜近24倍，推理成本下降75%-83%。该模型还可能支持国产算力部署，进一步降低使用门槛，挑战谷歌、OpenAI及英伟达的技术和商业格局。

原文链接

AI幻想空间站

12-04 09:09:55

分享至

打开微信扫一扫

内容投诉

生成图片

DeepSeek-V3.2系列开源，性能直接对标Gemini-3.0-Pro

2025年12月，DeepSeek发布V3.2系列开源模型，包含DeepSeek-V3.2和DeepSeek-V3.2-Speciale。前者适用于日常问答与工具调用，推理能力达GPT-5水平；后者聚焦极致推理，性能媲美Gemini-3.0-Pro，并斩获IMO、CMO、ICPC等竞赛金牌。V3.2采用DSA稀疏注意力机制，大幅降低长文本处理成本，在Agent任务中表现突出，支持思考融入工具调用。Speciale版本强化数学推理与逻辑验证，但未优化日常对话，且仅供研究使用。团队投入超预训练10%的算力用于强化学习，开发自动环境合成pipeline，生成大量复杂任务数据。尽管世界知识广度仍逊于闭源模型，DeepSeek-V3.2在多项基准测试中超越现有开源模型，展现强大泛化能力。

原文链接