5月29日,深度求索官方发布了DeepSeek-R1-0528的小版本更新详情。该版本基于2024年12月发布的DeepSeek V3 Base模型,通过加大后训练算力,显著增强了模型的推理能力和思维深度。在AIME 2025测试中,新版模型准确率提升至87.5%,相比旧版的70%有明显进步。此外,在 Humanity's Last Exam 测试中,新版模型的表现接近国际顶尖模型o3与Gemini-2.5-Pro。除推理能力外,幻觉问题也得到改善,幻觉率降低45%-50%。新版本还优化了创意写作、工具调用及前端代码生成等功能,并同步更新API,新增Function Calling和JsonOutput支持。DeepSeek-R1-0528模型权重已开源,上下文长度达128K,兼容MIT License。
原文链接
本文链接:https://kx.umi6.com/article/19477.html
转载请注明文章出处
相关推荐
换一换
智能驾驶水面之下,“AI推理之争”暗流涌动
2025-04-01 11:20:56
“起大早赶晚集”的谷歌大模型,这次真的“遥遥领先”了?
2025-03-26 20:07:52
DeepSeek-R1-0528 更新官方详解:思考更深、推理更强,整体表现接近 o3
2025-05-29 20:40:27
马斯克:Grok 3表现优于我们所知的任何已发布产品
2025-02-13 17:27:15
第一个国产中文o1来了,直接数学竞赛题伺候!
2024-11-27 16:56:40
实测o3/o4-mini:3分钟解决欧拉问题,OpenAI最强模型名副其实!
2025-04-17 16:41:08
非技术人10分钟读懂Deepseek R1
2025-02-14 18:44:39
用“草莓”对抗幻觉?OpenAI新项目隐含人工智能升级关键线索
2024-07-13 12:30:05
让AI自发推理!引发热议的“DeepSeek”到底是个啥
2025-02-01 01:08:43
实测OpenAI最强模型o1:会做大学数理化,但弱智吧依然难解
2024-09-15 14:50:14
OpenAI“草莓”推理大模型两周内就要上架?用户恐将面临耐心考验
2024-09-11 03:18:27
OpenAI正在悄悄研发代号“草莓”的神秘项目,其能力或已达到博士水平
2024-07-15 18:48:38
清华&通院推出”绝对零”训练法,零外部数据大模型自我博弈解锁推理能力
2025-05-12 17:37:13
622 文章
413948 浏览
24小时热文
更多
-
2026-01-23 08:40:41 -
2026-01-23 06:34:26 -
2026-01-23 00:20:44