1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

4月15日,科技媒体bleepingcomputer报道,OpenAI最新发布的GPT-4.1系列模型在编程能力上显著提升,其中GPT-4.1的SWE-bench Verified得分达54.6%,远超GPT-4o(21.4%)和GPT-4.5(26.6%)。然而,在与谷歌Gemini系列对比中,GPT-4.1仍显逊色。Stagehand基准数据显示,Gemini 2.0 Flash的错误率为6.67%,精确匹配率达90%,且成本仅为GPT-4.1的十分之一。此外,哈佛大学科学家Pierre Bongrand指出,GPT-4.1的性价比不及Gemini 2.5 Pro及DeepSeek等竞品。在编码专项测试中,GPT-4.1得分52%,而Gemini 2.5以73%的成绩领先。尽管如此,GPT-4.1作为非推理模型,其编码能力仍处于行业顶尖水平。

原文链接
本文链接:https://kx.umi6.com/article/17228.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
OpenAI 计划于今年下半年推出首款硬件设备
2026-01-20 00:22:40
OpenAI 更新手机版 ChatGPT,现支持手动调节 AI“思考深度”
2025-12-30 09:10:29
OpenAI:推出用户年龄预测功能 以保护未成年用户
2026-01-21 15:17:45
OpenAI的「梦醒时分」
2025-12-09 15:41:20
GPT-5.2 提前泄露?线索显示其已“超越 Gemini 3”
2025-12-11 16:00:08
消息称亚马逊讨论对 OpenAI 投资逾百亿美元,后者也有意 AWS 芯片
2025-12-17 18:57:01
亚马逊拟百亿投资OpenAI:看似各取所需 实则有人吃暗亏
2025-12-19 22:13:55
OpenAI拟在ChatGPT中测试定向广告加码营收增长计划
2026-01-17 04:09:18
年薪 55.5 万美元 + 股权,OpenAI 急招“安全防范负责人”
2025-12-28 08:15:58
算力越高收入越多!OpenAI率先验证AI商业Scaling Law
2026-01-20 11:02:06
OpenAI、Anthropic 讨论与生物技术及其他公司的数据交易
2025-12-17 23:08:38
OpenAI最新报告曝光!前5%精英效率暴涨16倍,普通人却被悄悄淘汰
2025-12-10 14:51:01
OpenAI 通信一把手 Hannah Wong 明年交棒,曾主导化解“奥尔特曼被罢免”公关危机
2025-12-16 14:46:45
24小时热文
更多
扫一扫体验小程序