1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

4月15日,科技媒体bleepingcomputer报道,OpenAI最新发布的GPT-4.1系列模型在编程能力上显著提升,其中GPT-4.1的SWE-bench Verified得分达54.6%,远超GPT-4o(21.4%)和GPT-4.5(26.6%)。然而,在与谷歌Gemini系列对比中,GPT-4.1仍显逊色。Stagehand基准数据显示,Gemini 2.0 Flash的错误率为6.67%,精确匹配率达90%,且成本仅为GPT-4.1的十分之一。此外,哈佛大学科学家Pierre Bongrand指出,GPT-4.1的性价比不及Gemini 2.5 Pro及DeepSeek等竞品。在编码专项测试中,GPT-4.1得分52%,而Gemini 2.5以73%的成绩领先。尽管如此,GPT-4.1作为非推理模型,其编码能力仍处于行业顶尖水平。

原文链接
本文链接:https://kx.umi6.com/article/17228.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
史上最大 AI 基建:OpenAI 将豪掷数万亿美元,打造“AI 宇宙工厂”
2025-08-16 17:28:15
OpenAI筹划万亿级AI基建 Altman希望设计新型融资工具
2025-08-16 05:22:34
天才少年背刺马斯克,疑窃取代码“叛逃”OpenAI?
2025-09-01 12:16:43
硅谷“抢人”大战中OpenAI先乱了?人事主管突然离职 据传也被“挖角”
2025-08-22 14:53:01
Gemini推出个性化功能更新
2025-08-14 08:51:38
OpenAI 奥尔特曼:现有的手机与电脑难以发挥 AI 潜力,需要更先进的硬件载体
2025-08-20 22:19:41
Anthropic:OpenAI 模型易被“滥用”,GPT 竟能提供炸药配方
2025-08-30 16:52:06
奥尔特曼:希望筹集数万亿美元建设数据中心 计划投资脑机接口公司
2025-08-15 23:21:48
OPENAI推出更强大的GPT-5模型 适用于编码和写作
2025-08-08 02:01:55
5000 亿美元估值傲视群雄,OpenAI 员工拟出售价值近 60 亿美元股份
2025-08-16 14:25:24
OpenAI 寻求增加收入,高管称不排除在 ChatGPT 内插入广告的可能
2025-08-15 10:11:06
建立1GW超算中心,OpenAI为什么选择印度?
2025-09-04 10:00:13
OpenAI 推出印度专属低价订阅计划 ChatGPT Go,每月 399 卢比
2025-08-19 12:59:12
24小时热文
更多
扫一扫体验小程序