OpenAI发布了GPT-4.1系列,包括旗舰版GPT-4.1、高性价比的GPT-4.1 mini和超轻量的GPT-4.1 nano。新模型主要面向开发者,通过API接口提供服务,全面超越了GPT-4o及其mini版本,在编码能力、指令遵循和长文本处理等方面实现提升。GPT-4.1在SWE-bench测试中得分54.6%,超过GPT-4o的33.2%及GPT-4.5的38.0%,尤其在代码差异处理和无关编辑频率上表现更优。
指令遵循能力也显著增强,在MultiChallenge测试中得分38.3%,比GPT-4o提升了10.5个百分点。此外,GPT-4.1全系支持百万级长文本处理,上下文窗口达100万Token,性能在复杂场景下表现突出。视觉理解能力同样升级,旗舰版在Video-MME测试中达到72.0%的SOTA成绩。
定价策略更具吸引力,GPT-4.1 mini和nano版本成本更低,Prompt Caching折扣提升至75%。GPT-4.1系列的整体表现被视为对其他厂商的有力回应,但仍存在与顶级竞品在某些基准上的差距。尽管命名体系复杂,OpenAI通过此更新再次强调了对开发者的重视,同时向竞争对手施加压力。未来,更多版本的发布值得期待。
原文链接
本文链接:https://kx.umi6.com/article/17199.html
转载请注明文章出处
相关推荐
换一换
小游戏开发者生存图鉴2024
2024-07-22 12:52:32
0.5B以小搏大拿下端侧模型新SOTA:4090可跑,长文本处理5倍常规加速丨清华&面壁开源
2025-06-10 16:50:15
为何开发者们纷纷弃用谷歌Gemini
2024-09-19 16:24:11
腾讯发最大开源MoE模型,3890亿参数免费可商用,跑分超Llama3.1
2024-11-07 10:16:21
OpenAI发布GPT-4.1 ,吊打GPT-4.5,14万/月的博士级AI曝光
2025-04-15 08:22:07
第一批DeepSeek开发者,现在怎么样了?
2025-02-19 20:58:29
OpenAI对标DeepSeek的开源模型,本周就要来了?
2025-04-14 13:32:36
LG 发布 EXAONE 3.5 开源 AI 模型:长文本处理利器、独特技术有效降低“幻觉”
2024-12-11 09:21:31
魔搭社区成中国最大AI开源社区 已服务全球超2000万开发者
2025-11-22 15:22:10
苹果官宣“WWDC25”:6月9日拉开帷幕 重点介绍软件最新进展
2025-03-26 09:47:41
OpenAI发布GPT-4.1:开发者“特供”,超越4o,但还没遥遥领先
2025-04-15 15:34:47
字节跳动发布“豆包MarsCode”智能开发工具,面向国内开发者免费
2024-06-27 17:59:36
Qwen开源首个长文本新模型,百万Tokens处理性能超GPT-4o-mini
2025-01-27 14:30:40
637 文章
446116 浏览
24小时热文
更多
-
2026-01-23 00:20:44 -
2026-01-22 23:18:34 -
2026-01-22 23:17:29