OpenAI发布了GPT-4.1系列,包括旗舰版GPT-4.1、高性价比的GPT-4.1 mini和超轻量的GPT-4.1 nano。新模型主要面向开发者,通过API接口提供服务,全面超越了GPT-4o及其mini版本,在编码能力、指令遵循和长文本处理等方面实现提升。GPT-4.1在SWE-bench测试中得分54.6%,超过GPT-4o的33.2%及GPT-4.5的38.0%,尤其在代码差异处理和无关编辑频率上表现更优。
指令遵循能力也显著增强,在MultiChallenge测试中得分38.3%,比GPT-4o提升了10.5个百分点。此外,GPT-4.1全系支持百万级长文本处理,上下文窗口达100万Token,性能在复杂场景下表现突出。视觉理解能力同样升级,旗舰版在Video-MME测试中达到72.0%的SOTA成绩。
定价策略更具吸引力,GPT-4.1 mini和nano版本成本更低,Prompt Caching折扣提升至75%。GPT-4.1系列的整体表现被视为对其他厂商的有力回应,但仍存在与顶级竞品在某些基准上的差距。尽管命名体系复杂,OpenAI通过此更新再次强调了对开发者的重视,同时向竞争对手施加压力。未来,更多版本的发布值得期待。
原文链接
本文链接:https://kx.umi6.com/article/17199.html
转载请注明文章出处
相关推荐
换一换
Bragi 与 OpenAI 合作推出 ChatAI 应用,为耳机装上 GPT-4.1
2025-07-29 22:35:57
全员免费!GPT-4.1上线ChatGPT,首波实测:又快又没油腻感
2025-05-16 13:40:45
云厂商布局MCP的方向有何不同?
2025-04-14 17:46:33
腾讯发最大开源MoE模型,3890亿参数免费可商用,跑分超Llama3.1
2024-11-07 10:16:21
开发者,找找找丨300w呼唤天才的你
2025-02-17 09:49:51
魔搭社区成中国最大AI开源社区 已服务全球超2000万开发者
2025-11-22 15:22:10
「小白」跑步入场小游戏
2025-03-24 16:04:08
苹果AI“百亿补贴”来了:免费开放端侧模型
2025-06-10 15:50:45
小游戏开发者生存图鉴2024
2024-07-22 12:52:32
工信部副部长熊继军:加快完善我国开源生态体系建设
2025-02-22 12:37:36
Qwen开源首个长文本新模型,百万Tokens处理性能超GPT-4o-mini
2025-01-27 14:30:40
阿里通义千问发布 Qwen2.5-Turbo 开源 AI 模型:支持 100 万 tokens 上下文,处理时间缩短至 68 秒
2024-11-19 14:52:17
OpenAI 再掀 AI 浪潮:GPT-4.1 被曝下周登场,满血版 o3 与 o4 mini 蓄势待发
2025-04-11 10:39:39
658 文章
487990 浏览
24小时热文
更多
-
2026-03-09 21:13:27 -
2026-03-09 20:09:26 -
2026-03-09 20:09:18