1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

4月15日,科技媒体bleepingcomputer报道,OpenAI最新发布的GPT-4.1系列模型在编程能力上显著提升,其中GPT-4.1的SWE-bench Verified得分达54.6%,远超GPT-4o(21.4%)和GPT-4.5(26.6%)。然而,在与谷歌Gemini系列对比中,GPT-4.1仍显逊色。Stagehand基准数据显示,Gemini 2.0 Flash的错误率为6.67%,精确匹配率达90%,且成本仅为GPT-4.1的十分之一。此外,哈佛大学科学家Pierre Bongrand指出,GPT-4.1的性价比不及Gemini 2.5 Pro及DeepSeek等竞品。在编码专项测试中,GPT-4.1得分52%,而Gemini 2.5以73%的成绩领先。尽管如此,GPT-4.1作为非推理模型,其编码能力仍处于行业顶尖水平。

原文链接
本文链接:https://kx.umi6.com/article/17228.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
缺乏实质证据 美国法院暂时驳回xAI针对OpenAI的商业机密侵权指控
2026-02-25 17:42:04
OpenAI 新功能曝光:代号“奏鸣曲”,猜测与 ChatGPT 音频体验有关
2026-01-19 19:09:37
AWS与OpenAI联合开发“有状态运行时环境” 预计数月内推出
2026-02-28 14:23:02
黄仁勋反悔,不投千亿美元给OpenAI了?
2026-02-03 02:13:44
OpenAI:关于芯片供应 公司已做到“对未来需求心中有数”
2026-02-20 07:10:46
谷歌Home升级实时搜索:Gemini能看懂摄像头画面
2026-03-03 23:44:30
OpenAI为员工定制特殊版ChatGPT
2026-02-12 19:45:50
OpenAI ChatGPT 将引入广告“供养”AGI,奥尔特曼承诺不干扰 AI 答案生成
2026-01-17 10:22:14
“红色警报”奏效吗 OpenAI称霸企业级AI市场 碾压谷歌
2026-01-16 19:53:11
韩国三大电视台因版权问题起诉OpenAI
2026-02-23 19:09:59
OpenAI最新融资1100亿美元!英伟达亚马逊软银都抢到船票了
2026-02-28 12:08:27
离家50米远 是走着去还是开车去?洗车问题难倒一众AI
2026-02-11 09:09:15
OpenAI在ChatGPT中加载广告,这是一个1.4万亿美元的市场
2026-01-21 13:10:00
24小时热文
更多
扫一扫体验小程序