近日,网页编程能力排行榜迎来更新,DeepSeek-R1凭借出色表现超越Claude 4,荣登全球编程能力榜首。尽管Claude Opus 4一直被视为顶级编码模型,但DeepSeek-R1在LiveCodeBench上的优异成绩引发关注。实测显示,DeepSeek-R1能够快速生成多种编程任务代码,例如34秒内完成带有交互功能的太阳系动画程序,以及23秒内生成现代化AGI主题网页代码。然而,其在复杂任务如俄罗斯方块开发中仍存不足,多次运行均出现bug及交互功能缺失问题。尽管如此,DeepSeek-R1因其开源特性及易用性受到国内用户的青睐。此外,DeepSeek-R1还在多个开源模型榜单中名列前茅,MIT许可证加持下,其综合实力不容小觑。值得注意的是,Kimi新模型Kimi-Dev近期以60.4%的成绩刷新代码开源SOTA记录,挑战着现有编程模型的领先地位。
原文链接
本文链接:https://kx.umi6.com/article/20321.html
转载请注明文章出处
相关推荐
换一换
Andrej Karpathy 最新视频盛赞 DeepSeek:R1 正在发现人类思考的逻辑并进行复现
2025-02-07 15:00:52
网易有道全面拥抱DeepSeek-R1,推理大模型加速个性化教学升级
2025-02-06 18:36:42
vivo 正式上线满血版 DeepSeek-R1
2025-02-25 17:01:36
自家芯片助力:SambaNova 推出“最快”DeepSeek-R1 671B 模型推理云服务
2025-02-21 17:53:53
智联招聘官宣接入DeepSeek:推出AI招聘助手“Ailin”
2025-02-06 16:34:25
最强编码模型Claude 4!7小时不间断写代码,连玩24小时宝可梦,GitHub已选为Copilot底层模型
2025-05-23 09:46:06
网易有道全线AI应用接入DeepSeek-R1
2025-02-06 17:34:52
腾讯文档接入 DeepSeek-R1 满血版,支持实时联网搜索
2025-02-17 15:55:37
DeepSeek 在网文领域首次应用,阅文“作家助手”升级三大辅助创作功能
2025-02-05 20:13:01
腾讯元宝接入DeepSeek-R1满血版,首次引入第三方模型,能联网能调用微信独家生态
2025-02-13 16:04:01
腾讯元宝重大更新!接入Deepseek-R1满血版:免费用
2025-02-13 18:15:35
力压DeepSeek-R1!谷歌Gemini 2.0系列集体上新,全员跻身大模型竞技场前10
2025-02-06 12:29:24
OPPO ColorOS 正式接入满血 DeepSeek-R1:支持语音唤醒交互,40+机型可体验
2025-02-26 12:31:58
708 文章
608753 浏览
24小时热文
更多
-
2026-06-08 23:49:41 -
2026-06-08 21:46:02 -
2026-06-08 19:42:13