OpenAI发布了GPT-4.1系列,包括旗舰版GPT-4.1、高性价比的GPT-4.1 mini和超轻量的GPT-4.1 nano。新模型主要面向开发者,通过API接口提供服务,全面超越了GPT-4o及其mini版本,在编码能力、指令遵循和长文本处理等方面实现提升。GPT-4.1在SWE-bench测试中得分54.6%,超过GPT-4o的33.2%及GPT-4.5的38.0%,尤其在代码差异处理和无关编辑频率上表现更优。
指令遵循能力也显著增强,在MultiChallenge测试中得分38.3%,比GPT-4o提升了10.5个百分点。此外,GPT-4.1全系支持百万级长文本处理,上下文窗口达100万Token,性能在复杂场景下表现突出。视觉理解能力同样升级,旗舰版在Video-MME测试中达到72.0%的SOTA成绩。
定价策略更具吸引力,GPT-4.1 mini和nano版本成本更低,Prompt Caching折扣提升至75%。GPT-4.1系列的整体表现被视为对其他厂商的有力回应,但仍存在与顶级竞品在某些基准上的差距。尽管命名体系复杂,OpenAI通过此更新再次强调了对开发者的重视,同时向竞争对手施加压力。未来,更多版本的发布值得期待。
原文链接
本文链接:https://kx.umi6.com/article/17199.html
转载请注明文章出处
相关推荐
.png)
换一换
“复仇”升级,马斯克手撕阿尔特曼
2024-11-27 18:00:12
美图创始人吴欣鸿:未来“生成”会比“拍摄”更普遍
2024-06-12 20:23:20
美光股价盘后下跌 因营收预期未满足投资者极高的期待
2024-06-27 19:10:08
435 文章
74142 浏览
24小时热文
更多

-
2025-07-18 23:46:25
-
2025-07-18 22:47:06
-
2025-07-18 22:46:21