5月28日,DeepSeek宣布DeepSeek-R1模型完成小版本试升级,API服务短暂中断5分钟。5月29日开源R1最新0528版本,这是R1自1月推出以来的首次更新。更新后的R1-0528在数学、编程等能力上接近国际顶尖模型,幻觉率降低45%-50%。此次更新通过后训练提升了模型的思维深度与推理能力,但上下文长度仍为64K,低于部分竞争对手。DeepSeek称R2模型可能需等待V4模型完成后推出。梁文锋团队专注于模型本身而非急于商业化,与转向AI Agent的行业趋势不同。DeepSeek的坚持得到英伟达CEO黄仁勋认可,其股价因DeepSeek更新未受负面影响。
原文链接
本文链接:https://kx.umi6.com/article/19532.html
转载请注明文章出处
相关推荐
.png)
换一换
汪军对话 Rich Sutton:大模型在一定程度上分散了我们对智能理解的注意力
2025-09-28 11:53:51
DeepSeek V3.2、GLM4.6等大模型即将发布
2025-09-29 17:14:30
Q2财报启示录:AI为大厂们带来了新「钱景」
2025-09-03 14:46:42
你用的大模型是什么MBTI?
2025-09-23 20:23:14
讯飞星火 X1 升级版模型宣布上线:整体效果对标 OpenAI o3 等国内外一流大模型
2025-07-25 14:25:03
GPT-5 没有惊喜,但信号拉满
2025-08-11 13:00:45
大模型自信心崩塌!谷歌DeepMind证实:反对意见让GPT-4o轻易放弃正确答案
2025-07-20 16:05:44
阿里巴巴CEO吴泳铭:大模型是下一代操作系统 AI Cloud是下一代计算机
2025-09-24 10:37:04
阿里、智谱等扎堆发布大模型 编程、金融等方向成焦点
2025-07-30 20:55:52
当AI智能体走进诊室,大模型如何颠覆医疗?
2025-07-30 13:48:25
把枯燥的工作先扔给大模型?
2025-08-15 12:12:45
上海累计82款大模型通过备案
2025-07-10 11:28:53
马斯克Grok-4碾压所有大模型!“比所有博士聪明”,AIME25拿满分
2025-07-10 16:23:20
549 文章
250905 浏览
24小时热文
更多

-
2025-10-24 03:21:23
-
2025-10-24 01:20:07
-
2025-10-24 00:18:56