1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

2025年8月12日,OpenAI因GPT-5在SWE-bench Verified测试中被质疑作弊引发争议。测试显示GPT-5得分74.9%,略高于Claude Opus 4.1的74.5%,但GPT-5仅完成477道题,少做23道难题,理由是‘基础设施无法运行’。分析机构SemiAnalysis指出,若将未答题算零分,GPT-5成绩会下降。此外,OpenAI推出的SWE-bench Verified测试集经过筛选,剔除了高难度题目,被批评为‘既是裁判又是选手’。而在更原汁原味的swebench.com榜单上,Claude 4 Opus反而领先。同日,OpenAI内部模型在IOI 2025竞赛中取得AI组第一,但该版本与公开版性能有差距。争议背后,AI竞赛中的微小差异成为营销焦点,但用户更关注价格优势,GPT-5价格仅为竞品的十分之一。

原文链接
本文链接:https://kx.umi6.com/article/23418.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
马斯克指责苹果在应用商店偏袒OpenAI 奥特曼回应:希望对马斯克操纵X展开调查
2025-08-12 11:22:32
OpenAI GPT-5 编程成绩有猫腻:自删 23 道测试题,关键基准还是自己提的
2025-08-12 13:18:21
实测GPT-5:写作坠入谷底,编程一骑绝尘
2025-08-08 09:11:19
“还我GPT-4o”!奥特曼强推GPT-5惹怒网友,紧急公关来了
2025-08-09 17:33:33
四种变体可选:OpenAI 最强模型 GPT-5 宣传文案遭偷跑,增强代码质量 / 用户体验
2025-08-07 15:52:58
第一时间体验GPT-5,人人免费可用,马斯克表示不服
2025-08-08 06:03:18
GPT-5测试被质疑作弊,故意避开难题刷高分?
2025-08-12 12:18:06
刚刚,GPT-5正式发布,奥特曼:这是全球最好的模型
2025-08-08 02:00:49
Claude断供OpenAI,AI编程竞争再升级
2025-08-05 08:13:36
奥尔特曼最新发声:OpenAI乐于选择亏损 不关心马斯克
2025-08-09 01:22:32
GPT-5发布了,到底有没有那么神?
2025-08-08 09:10:02
OpenAI、谷歌和Anthropic在美国获得民用合同批准
2025-08-05 21:21:41
全员百万富翁:消息称 OpenAI 为防 Meta 挖角,2 年内为每名员工提供 150 万美元奖金
2025-08-07 18:54:52
24小时热文
更多
扫一扫体验小程序