5月28日,DeepSeek宣布DeepSeek-R1模型完成小版本试升级,API服务短暂中断5分钟。5月29日开源R1最新0528版本,这是R1自1月推出以来的首次更新。更新后的R1-0528在数学、编程等能力上接近国际顶尖模型,幻觉率降低45%-50%。此次更新通过后训练提升了模型的思维深度与推理能力,但上下文长度仍为64K,低于部分竞争对手。DeepSeek称R2模型可能需等待V4模型完成后推出。梁文锋团队专注于模型本身而非急于商业化,与转向AI Agent的行业趋势不同。DeepSeek的坚持得到英伟达CEO黄仁勋认可,其股价因DeepSeek更新未受负面影响。
原文链接
本文链接:https://kx.umi6.com/article/19532.html
转载请注明文章出处
相关推荐
.png)
换一换
1万tokens是检验长文本的新基准,超过后18款大模型集体失智
2025-07-17 15:23:24
大模型“记性差一点”反而更聪明!金鱼损失随机剔除token,让AI不再死记硬背
2025-09-03 17:49:26
字节跳动、阿里AI“大将”出走 大模型厂商中高层流动持续
2025-08-25 21:35:41
大模型再「战」高考:从一本直升 985
2025-06-27 09:05:45
GPT-5 没有惊喜,但信号拉满
2025-08-11 13:00:45
一场对抗OpenAI们的“危险游戏”,值不值得投资
2025-07-23 08:46:29
消费电子将被大模型重新定义?云天励飞董事长陈宁:看好推理算力需求的爆发 全面押注AI芯片
2025-07-25 11:23:59
DeepSeek删豆包冲上热搜,大模型世子之争演都不演了
2025-08-21 13:31:42
2025大模型半年回顾:模型速度变缓
2025-06-25 19:34:48
大模型热度退潮,真正的技术创新者开始被「看见」
2025-06-20 17:06:44
梁文锋等来及时雨
2025-07-15 17:50:04
企业管理软件是不是和AI无关?
2025-06-23 13:23:28
一场「狼人杀」,考倒了一堆大模型
2025-08-28 14:28:50
501 文章
164461 浏览
24小时热文
更多

-
2025-09-06 20:38:03
-
2025-09-06 19:37:51
-
2025-09-06 16:37:17