11月19日,OpenAI发布全新编程模型GPT-5.1-Codex-Max,性能超越谷歌Gemini 3 Pro。新模型在多项编程基准测试中表现优异,例如SWE-Bench Verified准确率达77.9%,领先Gemini的76.2%;Terminal-Bench 2.0准确率为58.1%,高于Gemini的54.2%。其核心升级为“压缩”机制,可智能保留关键上下文信息,支持连续工作超24小时且效率提升30%。目前,该模型已集成至OpenAI多个开发工具,如Codex CLI和代码审查工具,但尚未开放公共API,需订阅ChatGPT Plus等付费计划使用。OpenAI内部数据显示,工程师使用Codex后提交的拉取请求增加70%。官方强调,Codex-Max旨在辅助而非替代开发者,并通过沙盒环境和详细日志确保安全性和透明性。
原文链接
本文链接:https://kx.umi6.com/article/28753.html
转载请注明文章出处
相关推荐
换一换
网页编程众测排名:DeepSeek-R1超越Claude 4加冕全球第一
2025-06-17 16:24:38
Gemini 2.5 Pro登顶三冠王!AI最强编程屠榜,全面碾压Claude 3.7
2025-05-07 17:12:34
OpenAI 发布最强编程模型 GPT-5.1-Codex-Max:AI 程序员能“通宵”,性能跑分反超谷歌
2025-11-20 08:05:50
GPT-4.1正式上线ChatGPT,网友辣评:4.1>4.5
2025-05-16 14:34:48
阿里通义千问推出编程模型Qwen3-Coder-Flash
2025-08-01 09:24:35
Claude4.5刚刚发布,能连肝30多个小时,史上最卷AI 诞生
2025-09-30 07:20:16
全球最佳编程 AI 模型:Claude Sonnet 4.5 登场,自主写代码超 30 小时、更像“一位同事”
2025-09-30 08:22:36
最强开源CodeLLM模型深夜来袭!320亿参数,Qwen2.5-Coder新模型超越GPT-4o
2024-11-12 13:03:56
OpenAI 推出 GPT-5-Codex-Mini:“经济高效型”AI 编程模型
2025-11-08 16:47:26
全球大储争霸战
2025-11-20 09:08:17
Gemini 3打服奥特曼马斯克,谷歌CEO却在担心AI泡沫
2025-11-19 14:17:44
花旗:AI股票只是暂时回调 但基建瓶颈是个挑战
2025-11-19 12:19:00
富达国际:AI牛市将克服“泡沫论”,英伟达发布财报后就会反弹!
2025-11-19 12:18:03
564 文章
323752 浏览
24小时热文
更多
-
2025-11-20 12:21:44 -
2025-11-20 12:20:58 -
2025-11-20 12:20:36