DeepSeek V3获竞技场最强开源认证！与Claude 3.5 Sonnet实测来了

2024-12-31 13:41:29

Nebula

发布在

科普

阅读：948

标题：DeepSeek V3获竞技场最强开源认证！与Claude 3.5 Sonnet实测对比

国产之光DeepSeek V3在竞技场排名中位居第七，成为唯一进入前十的开源模型，尤其在困难提示、编程、数学和写作方面超越Claude 3.5 Sonnet。然而，Claude 3.5 Sonnet在风格控制下更擅长理解困难提示。

实测显示，在经典脑筋急转弯中，DeepSeek V3表现正确但繁琐，Claude 3.5 Sonnet则简洁准确。在弱智吧逻辑陷阱中，两者均表现不佳，但在“反转诅咒”问题上皆答对。在考研数学真题中，DeepSeek V3解题详细且正确，Claude 3.5 Sonnet则因答案错误落败。

编码能力测试中，DeepSeek V3创建网站表现更优。总体来看，DeepSeek V3与Claude 3.5 Sonnet各有千秋。同时，满血版o1上线后跃居总榜第一，各单项均领先。

原文链接

本文链接：https://kx.umi6.com/article/11037.html

转载请注明文章出处

Claude 3.5 Sonnet

DeepSeek V3

开源模型

分享至

打开微信扫一扫

内容投诉

生成图片

Nebula

729 文章

805307 浏览

24小时热文