1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

DeepSeek R1新版本R1-0528在端午节前发布,引发广泛关注。尽管名为“小版本升级”,其实力却不容小觑,在LiveCodeBench上的表现几乎与OpenAI o3-high持平。新版本在多项任务中的表现尤为突出,例如解决了困扰其他顶级模型的“9.9-9.11=?”难题,并在小球弹跳实验中展现出显著进步。

新模型具备深度推理能力,写作任务更加自然流畅,推理风格快速且深思熟虑,每个任务最多可思考30-60分钟。目前,该模型已在HuggingFace上以MIT协议开放下载。

实测显示,新版R1在处理复杂问题时表现出色,例如解答“让7米长的甘蔗通过2米高1米宽的门”的经典难题,耗时151秒后给出了有趣的解决方案。其编程能力和前端设计能力也得到大幅提升,仅用24秒便完成了Three.js模拟太阳系的任务,并生成了交互式网页设计。

此外,R1-0528在开源领域再次缩小了与闭源模型的差距,展现了开源技术的强大潜力。HuggingFace地址:https://huggingface.co/deepseek-ai/DeepSeek-R1-0528

原文链接
本文链接:https://kx.umi6.com/article/19428.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
宇树:开源机器人世界大模型!
2025-09-16 13:11:33
DeepSeek等开源模型,更“浪费”token吗?
2025-10-11 10:17:13
别太相信DeepSeek
2025-08-14 18:02:41
「DeepSeek们」回答位变广告位
2025-08-05 15:15:26
DeepSeek 下一代技术提前曝光,梁文锋署名论文获 ACL 2025 最佳论文奖
2025-08-01 17:03:23
华为盘古718B模型最新成绩:开源第二
2025-09-29 13:08:42
阿里达摩院首次开源具身智能“三大件”机器人上下文协议
2025-08-11 13:01:00
阿里开源全模态大模型Qwen3-Omni 可像人类一样听说写
2025-09-24 16:50:21
DeepSeek终于把OpenAI逼急了
2025-08-06 16:35:39
OpenAI开源两款gpt-oss系列推理大模型 能力接近o3和o4-mini
2025-08-06 11:30:27
Qwen又立功,全球最快开源模型诞生,超2000 tokens/秒!
2025-09-10 19:40:11
DeepSeek 通知线上模型版本升级至 V3.1,上下文长度拓展至 128k
2025-08-19 21:05:45
黄仁勋力赞 DeepSeek,称中国创新的步伐不可能被阻挡
2025-07-21 09:13:49
24小时热文
更多
扫一扫体验小程序