4月15日,科技媒体bleepingcomputer报道,OpenAI最新发布的GPT-4.1系列模型在编程能力上显著提升,其中GPT-4.1的SWE-bench Verified得分达54.6%,远超GPT-4o(21.4%)和GPT-4.5(26.6%)。然而,在与谷歌Gemini系列对比中,GPT-4.1仍显逊色。Stagehand基准数据显示,Gemini 2.0 Flash的错误率为6.67%,精确匹配率达90%,且成本仅为GPT-4.1的十分之一。此外,哈佛大学科学家Pierre Bongrand指出,GPT-4.1的性价比不及Gemini 2.5 Pro及DeepSeek等竞品。在编码专项测试中,GPT-4.1得分52%,而Gemini 2.5以73%的成绩领先。尽管如此,GPT-4.1作为非推理模型,其编码能力仍处于行业顶尖水平。
原文链接
本文链接:https://kx.umi6.com/article/17228.html
转载请注明文章出处
相关推荐
换一换
OpenAI大神教你如何榨干Codex
2026-05-23 18:54:39
马斯克:若告赢OpenAI 上千亿美元收益全部捐给慈善机构
2026-03-17 17:54:30
OpenAI推出药物研发AI模型 挑战谷歌
2026-04-17 05:42:36
奥特曼趁马斯克出差爆猛料:他曾想让子女继承OpenAI
2026-05-13 12:33:09
OpenAI三位高管同日离职
2026-04-21 00:33:46
马斯克称OpenAI是自己的创意 现任CEO奥尔特曼是“小偷”
2026-04-29 14:26:51
OpenAI新模型不是GPTX!全新预训练“土豆”曝光,Sora成弃子的原因找到了
2026-04-05 18:01:58
OpenAI首席执行官:AI普及并不会引发“就业末日”
2026-05-26 16:40:26
中信证券:合纵连横PE巨头 OpenAI与Anthropic加速布局企业级AI市场
2026-05-15 08:31:57
GPT-5.4发布:OpenAI首个大一统模型,简直是龙虾原生
2026-03-06 09:42:29
OpenAI就第三方库安全事件发布公告:未发现用户数据泄露或系统遭入侵
2026-04-11 09:56:17
OpenAI CEO发文感谢开发者引众怒!程序员痛斥:AI巨头对人类劳动用完即弃
2026-03-19 17:15:35
给「对手」的钱比给「盟友」多,亚马逊疯了吗?
2026-04-30 12:20:19
731 文章
651223 浏览
24小时热文
更多
-
2026-06-09 00:54:40 -
2026-06-09 00:53:08 -
2026-06-08 23:49:41