5月28日,深度求索(Deepseek)推出开源模型DeepSeek R1-0528,其编程能力显著提升,尤其在复杂指令处理和前端页面生成方面表现突出。据初步测试,R1-0528在Live CodeBench中的性能可媲美OpenAI的o3模型(High)。在Extended NYT Connections基准测试中,该模型得分49.8,较初代Deepseek R1的38.6分大幅提升。此基准测试基于《纽约时报》的Connections谜题游戏,难度升级,全面评估语言理解和推理能力。R1-0528不仅在编程能力上接近o3和o4-mini,还在代码补全及审美设计上展现优异表现,且推理速度更快,提供更流畅的用户体验。
原文链接
本文链接:https://kx.umi6.com/article/19423.html
转载请注明文章出处
相关推荐
换一换
AWS与OpenAI联合开发“有状态运行时环境” 预计数月内推出
2026-02-28 14:23:02
OpenAI据悉拟在ChatGPT中接入视频生成工具Sora
2026-03-11 16:17:18
OpenAI计划年底前将员工人数增加近一倍至8000人
2026-03-21 20:42:38
GLM-5.1上线,编程表现贴Opus 4.6开大,Coding plan瞬间断货
2026-03-28 15:00:54
OpenAI已与广告交易平台进行谈判
2026-03-05 10:05:53
截至上月末 OpenAI年化收入突破250亿美元
2026-03-05 12:14:25
OpenAI据悉完成了新AI模型的初步开发
2026-03-25 04:57:32
OpenAI与美国军方合作引发用户反对:ChatGPT卸载量增加295% 一星评价激增775%
2026-03-03 11:59:16
OpenAI拟运用AI助力药企研发并从中获利
2026-02-04 08:29:27
OpenAI首席信息安全官宣布将离职
2026-01-27 14:22:25
软银集团4-12月净利润增至5倍 创历史同期新高
2026-02-12 16:32:10
OpenAI计划于2026年推出首款硬件设备
2026-01-19 23:22:26
马斯克:若告赢OpenAI 上千亿美元收益全部捐给慈善机构
2026-03-17 17:54:30
696 文章
560956 浏览
24小时热文
更多
-
2026-04-24 20:31:56 -
2026-04-24 20:29:51 -
2026-04-24 19:29:38