4月15日,科技媒体bleepingcomputer报道,OpenAI最新发布的GPT-4.1系列模型在编程能力上显著提升,其中GPT-4.1的SWE-bench Verified得分达54.6%,远超GPT-4o(21.4%)和GPT-4.5(26.6%)。然而,在与谷歌Gemini系列对比中,GPT-4.1仍显逊色。Stagehand基准数据显示,Gemini 2.0 Flash的错误率为6.67%,精确匹配率达90%,且成本仅为GPT-4.1的十分之一。此外,哈佛大学科学家Pierre Bongrand指出,GPT-4.1的性价比不及Gemini 2.5 Pro及DeepSeek等竞品。在编码专项测试中,GPT-4.1得分52%,而Gemini 2.5以73%的成绩领先。尽管如此,GPT-4.1作为非推理模型,其编码能力仍处于行业顶尖水平。
原文链接
本文链接:https://kx.umi6.com/article/17228.html
转载请注明文章出处
相关推荐
换一换
ChatGPT 诞生三年,OpenAI 还未取得绝对领先
2025-12-04 12:18:49
AI领域“强强联手”:OpenAI与富士康达成合作,在美生产新兴硬件!
2025-11-21 10:14:21
OpenAI 奥尔特曼发布 GPT-5.1 系列:ChatGPT 情商大涨,AI 默认语气变“暖男”
2025-11-13 08:48:23
谷歌 Gemini 3 反击战:OpenAI GPT-5.2 被曝提前至下周发布,从新功能转向速度与稳定性提升
2025-12-06 09:19:14
ChatGPT教唆致多名用户自杀:已出现七宗诉讼!OpenAI:无比痛心
2025-11-10 00:51:16
OpenAI 大胆预测:2030 年 ChatGPT 周活用户 26 亿,其中 2.2 亿人选择订阅
2025-11-26 10:36:37
孙正义再次清仓英伟达!上一次教训“价值2500亿美元”
2025-11-12 17:13:01
Intel首席技术、AI官突然跳槽OpenAI!印度裔天才
2025-11-11 12:06:42
AI泡沫担忧愈演愈烈,这“烂摊子”就连英伟达也救不了?一文读懂
2025-11-24 17:09:10
OpenAI:我们的工具能让员工每天节省最多一小时专业工作时间
2025-12-08 21:49:12
业界风向标变了?OpenAI被票选为“最有可能失败初创公司”第二名!
2025-11-18 11:15:52
Nano Banana,OpenAI你学不会
2025-11-24 17:05:42
微软宣布组建超级智能团队,自研 AI 模型摆脱对 OpenAI 的依赖
2025-11-06 23:18:30
572 文章
350445 浏览
24小时热文
更多
-
2025-12-08 21:51:18 -
2025-12-08 21:49:12 -
2025-12-08 21:48:42