1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

4月15日,科技媒体bleepingcomputer报道,OpenAI最新发布的GPT-4.1系列模型在编程能力上显著提升,其中GPT-4.1的SWE-bench Verified得分达54.6%,远超GPT-4o(21.4%)和GPT-4.5(26.6%)。然而,在与谷歌Gemini系列对比中,GPT-4.1仍显逊色。Stagehand基准数据显示,Gemini 2.0 Flash的错误率为6.67%,精确匹配率达90%,且成本仅为GPT-4.1的十分之一。此外,哈佛大学科学家Pierre Bongrand指出,GPT-4.1的性价比不及Gemini 2.5 Pro及DeepSeek等竞品。在编码专项测试中,GPT-4.1得分52%,而Gemini 2.5以73%的成绩领先。尽管如此,GPT-4.1作为非推理模型,其编码能力仍处于行业顶尖水平。

原文链接
本文链接:https://kx.umi6.com/article/17228.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
截至上月末 OpenAI年化收入突破250亿美元
2026-03-05 12:14:25
全球算力产业,正在陪着OpenAI走钢丝
2026-01-22 13:55:20
谷歌Home升级实时搜索:Gemini能看懂摄像头画面
2026-03-03 23:44:30
解码OpenAI的2026
2026-02-04 02:07:37
OpenAI发布Windows版Codex应用
2026-03-05 10:04:49
OpenAI已与广告交易平台进行谈判
2026-03-05 10:05:53
Anthropic遭遇OpenAI贴身肉搏,上市路多了个坎
2026-01-31 12:30:58
Gemini重塑谷歌地图!一句话搞定出行攻略,网友:垂直应用全完蛋
2026-03-14 19:18:53
三个和尚没水喝!OpenAI星际之门搁浅,一年过去压根没动工
2026-02-23 15:34:57
OpenAI据悉考虑与北约签订合同
2026-03-04 14:47:17
OpenAI推出首款搭载英伟达竞争对手Cerebras芯片的AI模型
2026-02-13 02:57:22
OpenAI或为亚马逊AI产品开发定制化模型
2026-02-04 22:10:24
亚马逊据悉正在商谈向OpenAI投资高达500亿美元并扩大合作关系
2026-01-30 09:18:25
24小时热文
更多
扫一扫体验小程序