综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
12月5日,OpenAI宣布开放其最强编程模型GPT-5.1-Codex-Max的API访问权限,定价与GPT-5保持一致(输入1.25美元/百万token,输出10美元/百万token)。该模型专为长时间运行和复杂编程任务设计,支持超长上下文处理,可连续工作超24小时。性能方面,其在SWE-Bench Verified测试中得分77.9%,优于常规版的73.7%。此外,GPT-5.1-Codex-Max针对Windows环境优化,适合多平台开发者使用。目前,Cursor、GitHub Copilot等主流工具已完成集成,Pro及以上订阅用户可直接切换使用。
原文链接
2025年11月20日,OpenAI发布GPT-5.1-Codex-Max,突破上下文窗口限制,支持超长连续工作,最长可运行超过24小时,处理数百万token。新模型在任务效率、资源消耗及推理能力上显著提升,在METR指标中达到新SOTA,能以50%概率完成需人类2小时42分钟的软件工程任务。相比前代,其token使用减少30%,并新增xhigh推理力度选项,适合非延迟敏感任务。此外,GPT-5.1-Codex-Max原生支持压缩技术,可在接近上下文窗口限制时自动压缩对话,保持任务连贯性。目前,该模型已支持CLI、IDE扩展等工具,API即将上线。同日,OpenAI还低调推出GPT-5.1 Pro,指令遵循能力更强,但与Gemini 3仍有差距。硅谷近期迎来多款AI模型更新,包括Gemini 3和Grok 4.1 Fast,竞争激烈。
原文链接
11月19日,OpenAI发布全新编程模型GPT-5.1-Codex-Max,性能超越谷歌Gemini 3 Pro。新模型在多项编程基准测试中表现优异,例如SWE-Bench Verified准确率达77.9%,领先Gemini的76.2%;Terminal-Bench 2.0准确率为58.1%,高于Gemini的54.2%。其核心升级为“压缩”机制,可智能保留关键上下文信息,支持连续工作超24小时且效率提升30%。目前,该模型已集成至OpenAI多个开发工具,如Codex CLI和代码审查工具,但尚未开放公共API,需订阅ChatGPT Plus等付费计划使用。OpenAI内部数据显示,工程师使用Codex后提交的拉取请求增加70%。官方强调,Codex-Max旨在辅助而非替代开发者,并通过沙盒环境和详细日志确保安全性和透明性。
原文链接
加载更多
暂无内容