1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

5月28日,DeepSeek宣布DeepSeek-R1模型完成小版本试升级,API服务短暂中断5分钟。5月29日开源R1最新0528版本,这是R1自1月推出以来的首次更新。更新后的R1-0528在数学、编程等能力上接近国际顶尖模型,幻觉率降低45%-50%。此次更新通过后训练提升了模型的思维深度与推理能力,但上下文长度仍为64K,低于部分竞争对手。DeepSeek称R2模型可能需等待V4模型完成后推出。梁文锋团队专注于模型本身而非急于商业化,与转向AI Agent的行业趋势不同。DeepSeek的坚持得到英伟达CEO黄仁勋认可,其股价因DeepSeek更新未受负面影响。

原文链接
本文链接:https://kx.umi6.com/article/19532.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
开源模型TOP5,被中国厂商包圆了
2025-10-15 17:36:49
中国企业调用大模型日均超10万亿Tokens
2025-09-01 12:17:48
大模型“记性差一点”反而更聪明!金鱼损失随机剔除token,让AI不再死记硬背
2025-09-03 17:49:26
推理成本骤降75%!gpt-oss用新数据类型实现4倍推理速度,80GB显卡能跑1200亿参数大模型
2025-08-11 16:04:21
消费电子将被大模型重新定义?云天励飞董事长陈宁:看好推理算力需求的爆发 全面押注AI芯片
2025-07-25 11:23:59
国产模型+国产芯片“蜜月期”开启!DeepSeek、智谱密集上新 华为、寒武纪芯片火速适配
2025-09-30 21:35:35
大模型又迎来重要玩家!美团首个开源大模型来了
2025-09-01 18:28:28
把12个AI凑到一起打工,它们竟然搞起“小团体”?
2025-10-16 22:02:39
高性能计算群星闪耀时
2025-08-21 12:35:24
Scaling Law再遭质疑:“退化式AI”竟成终局?
2025-08-04 21:03:25
字节&MAP重塑大模型推理算法优化重点,强化学习重在高效探索助力LLM提升上限
2025-08-11 10:59:04
真正的AI竞争力,藏在大模型“后训练”这一步
2025-10-13 16:59:55
阿里、智谱等扎堆发布大模型 编程、金融等方向成焦点
2025-07-30 20:55:52
24小时热文
更多
扫一扫体验小程序