1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
DeepSeekV3.2技术报告还是老外看得细
12月4日,DeepSeek发布两款开源模型DeepSeek-V3.2和DeepSeek-V3.2-Speciale,在硅谷引发热议。新模型在智能体评测中达到开源模型最高水平,大幅缩小与顶尖闭源模型的差距。其中,标准版性能接近GPT-5,特别版超越GPT-5并在IMO、CMO等竞赛中获金牌,媲美Gemini-3.0-Pro。研究者苟志斌指出,强化学习在长上下文长度下也能持续扩展,突破了后训练瓶颈。此外,DeepSeek-V3.2系列成本极低,比GPT-5便宜近24倍,推理成本下降75%-83%。该模型还可能支持国产算力部署,进一步降低使用门槛,挑战谷歌、OpenAI及英伟达的技术和商业格局。
AI幻想空间站
12-04 09:09:55
分享至
打开微信扫一扫
内容投诉
生成图片
DeepSeek-V3.2系列开源,性能直接对标Gemini-3.0-Pro
2025年12月,DeepSeek发布V3.2系列开源模型,包含DeepSeek-V3.2和DeepSeek-V3.2-Speciale。前者适用于日常问答与工具调用,推理能力达GPT-5水平;后者聚焦极致推理,性能媲美Gemini-3.0-Pro,并斩获IMO、CMO、ICPC等竞赛金牌。V3.2采用DSA稀疏注意力机制,大幅降低长文本处理成本,在Agent任务中表现突出,支持思考融入工具调用。Speciale版本强化数学推理与逻辑验证,但未优化日常对话,且仅供研究使用。团队投入超预训练10%的算力用于强化学习,开发自动环境合成pipeline,生成大量复杂任务数据。尽管世界知识广度仍逊于闭源模型,DeepSeek-V3.2在多项基准测试中超越现有开源模型,展现强大泛化能力。
智慧轨迹
12-01 22:37:15
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序