OpenAI发布了GPT-4.1系列,包括旗舰版GPT-4.1、高性价比的GPT-4.1 mini和超轻量的GPT-4.1 nano。新模型主要面向开发者,通过API接口提供服务,全面超越了GPT-4o及其mini版本,在编码能力、指令遵循和长文本处理等方面实现提升。GPT-4.1在SWE-bench测试中得分54.6%,超过GPT-4o的33.2%及GPT-4.5的38.0%,尤其在代码差异处理和无关编辑频率上表现更优。
指令遵循能力也显著增强,在MultiChallenge测试中得分38.3%,比GPT-4o提升了10.5个百分点。此外,GPT-4.1全系支持百万级长文本处理,上下文窗口达100万Token,性能在复杂场景下表现突出。视觉理解能力同样升级,旗舰版在Video-MME测试中达到72.0%的SOTA成绩。
定价策略更具吸引力,GPT-4.1 mini和nano版本成本更低,Prompt Caching折扣提升至75%。GPT-4.1系列的整体表现被视为对其他厂商的有力回应,但仍存在与顶级竞品在某些基准上的差距。尽管命名体系复杂,OpenAI通过此更新再次强调了对开发者的重视,同时向竞争对手施加压力。未来,更多版本的发布值得期待。
原文链接
本文链接:https://kx.umi6.com/article/17199.html
转载请注明文章出处
相关推荐
换一换
LG 发布 EXAONE 3.5 开源 AI 模型:长文本处理利器、独特技术有效降低“幻觉”
2024-12-11 09:21:31
热门消除游戏《糖果传奇》引入生成式 AI:助力开发者重新设计超 1.8 万关卡
2025-05-12 19:40:02
云厂商布局MCP的方向有何不同?
2025-04-14 17:46:33
2025全球开发者先锋大会在上海徐汇开幕
2025-02-23 20:03:33
云计算“活教科书”语出惊人,指明程序员的进化方向
2025-10-24 16:43:46
GPT-4.1即将登场,但今天最让Altman兴奋的新功能不是它
2025-04-11 08:35:05
为何开发者们纷纷弃用谷歌Gemini
2024-09-19 16:24:11
OpenAI 再掀 AI 浪潮:GPT-4.1 被曝下周登场,满血版 o3 与 o4 mini 蓄势待发
2025-04-11 10:39:39
苹果官宣“WWDC25”:6月9日拉开帷幕 重点介绍软件最新进展
2025-03-26 09:47:41
小游戏开发者生存图鉴2024
2024-07-22 12:52:32
Bragi 与 OpenAI 合作推出 ChatAI 应用,为耳机装上 GPT-4.1
2025-07-29 22:35:57
DeepSeek下一代技术提前曝光
2025-07-31 09:02:46
GPT-4.1正式上线ChatGPT,网友辣评:4.1>4.5
2025-05-16 14:34:48
589 文章
372099 浏览
24小时热文
更多
-
2025-12-08 19:45:13 -
2025-12-08 19:43:05 -
2025-12-08 18:41:52