综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
2026年1月,OpenAI研究员Roon宣布完全依赖Codex编写代码,标志着AI编程从辅助工具转向核心生产力。Codex的Plan模式将编程分为意图理解与技术实施两阶段,极大提升效率。内部爆料称,Codex帮助团队仅用三天搭建服务器,三周发布APP。与此同时,Anthropic的Claude Code也展现出强大竞争力,硅谷自动编码狂潮愈演愈烈。然而,AI生成代码的高效性带来了审查难题,人类开发者面临注意力被淹没的风险。专家警示,系统架构与需求描述能力仍是不可替代的核心价值。此变革不仅重构程序员角色,也让非技术人员通过清晰表达需求参与开发。尽管AI编码工具已全面渗透,但生产环境中仍需谨慎使用。
原文链接
2026年1月15日,OpenAI宣布通过Responses API向开发者开放其最强代码模型GPT-5.2-Codex。该模型于2025年12月发布,是目前最先进的智能体编程AI,专为解决复杂软件工程问题设计。其核心突破包括“上下文压缩”技术和针对“智能体工作流”的深度优化,能够自主执行构建新功能、重构代码和排查漏洞等任务。OpenAI称其为“最具网络安全能力”的模型,在代码安全审计方面表现突出。实战案例中,AI代码编辑器Cursor利用GPT-5.2-Codex连续运行一周,生成超300万行代码,成功从零构建了一个功能完整的Web浏览器,包含Rust编写的渲染引擎及HTML解析等功能。该模型已在Cursor、GitHub等主流工具中支持,并在多项基准测试中取得领先成绩。
原文链接
2025年12月26日,OpenAI推出圣诞版Codex(GPT-5.2-Codex-XMas),为程序员送上节日福利。该模型功能与GPT-5.2-Codex相同,但增加了个性化升级,并将使用上限提升至平时的2倍,持续至次年1月1日。OpenAI强调其‘代理式编码’能力,优化了长上下文、跨文件任务及工程适配能力,同时新增可复用工作流机制,提升团队协作效率。然而,成本和环境配置仍是挑战。与此同时,Anthropic和Google也推出类似促销活动:Anthropic为订阅用户提升两倍使用额度;Google则通过免费试用和半价优惠降低门槛。三巨头在圣诞季展开激烈竞争,涵盖模型升级、生态布局和促销策略,目标直指AI编程市场主导权。
原文链接
12月19日,OpenAI发布最强智能体编程模型GPT-5.2-Codex,专为解决复杂软件工程问题设计。该模型基于GPT-5.2通用智能,融合GPT-5.1-Codex-Max终端操作能力,引入“上下文压缩”技术,大幅提升代码重构与迁移效率。其在Windows 10/11环境中优化显著,并能精准解读技术图表、UI截图及设计草图,快速将原型图转化为功能代码。GPT-5.2-Codex在SWE-Bench Pro等权威测试中刷新纪录,可独立完成代码库导航到Pull Request创建的全流程工作。案例显示,它在网络安全领域表现突出,协助Privy公司工程师挖掘React组件中的未知漏洞。为应对潜在风险,OpenAI启动“可信访问试点计划”,向安全专家开放高权限访问。目前,该模型已向ChatGPT付费用户全量推送,API访问权限将逐步开放。
原文链接
12月19日,OpenAI正式发布GPT-5.2-Codex,称其为迄今最先进的智能体编码模型,专为复杂软件工程任务优化。新模型基于GPT-5.2,针对编码场景深度改进,包括通过上下文压缩提升长程任务执行能力、在代码重构与迁移中表现更优、增强Windows环境兼容性,以及显著提升网络安全防御能力。这一更新标志着AI在编程领域的进一步突破,为开发者提供更高效工具。
原文链接
12月13日,OpenAI揭秘安卓版Sora开发过程。团队仅用28天完成任务,从10月8日启动到11月5日交付,4名工程师协作,85%代码由Codex生成,实现99.9%稳定率。Codex像一名高级工程师,能快速生成代码,但需明确指导目标与约束条件,且无法推断未告知信息,如架构模式或用户体验反馈。尽管Codex熟悉多种编程语言、积极编写单元测试,并可通过CI日志自我修复问题,但其深层架构推断能力有限,仍需人类监督质量与系统决策。最终,Codex高效执行明确任务,而人类专注于架构与体验优化。
原文链接
12月5日,OpenAI宣布开放其最强编程模型GPT-5.1-Codex-Max的API访问权限,定价与GPT-5保持一致(输入1.25美元/百万token,输出10美元/百万token)。该模型专为长时间运行和复杂编程任务设计,支持超长上下文处理,可连续工作超24小时。性能方面,其在SWE-Bench Verified测试中得分77.9%,优于常规版的73.7%。此外,GPT-5.1-Codex-Max针对Windows环境优化,适合多平台开发者使用。目前,Cursor、GitHub Copilot等主流工具已完成集成,Pro及以上订阅用户可直接切换使用。
原文链接
2025年11月20日,OpenAI发布GPT-5.1-Codex-Max,突破上下文窗口限制,支持超长连续工作,最长可运行超过24小时,处理数百万token。新模型在任务效率、资源消耗及推理能力上显著提升,在METR指标中达到新SOTA,能以50%概率完成需人类2小时42分钟的软件工程任务。相比前代,其token使用减少30%,并新增xhigh推理力度选项,适合非延迟敏感任务。此外,GPT-5.1-Codex-Max原生支持压缩技术,可在接近上下文窗口限制时自动压缩对话,保持任务连贯性。目前,该模型已支持CLI、IDE扩展等工具,API即将上线。同日,OpenAI还低调推出GPT-5.1 Pro,指令遵循能力更强,但与Gemini 3仍有差距。硅谷近期迎来多款AI模型更新,包括Gemini 3和Grok 4.1 Fast,竞争激烈。
原文链接
11月19日,OpenAI发布全新编程模型GPT-5.1-Codex-Max,性能超越谷歌Gemini 3 Pro。新模型在多项编程基准测试中表现优异,例如SWE-Bench Verified准确率达77.9%,领先Gemini的76.2%;Terminal-Bench 2.0准确率为58.1%,高于Gemini的54.2%。其核心升级为“压缩”机制,可智能保留关键上下文信息,支持连续工作超24小时且效率提升30%。目前,该模型已集成至OpenAI多个开发工具,如Codex CLI和代码审查工具,但尚未开放公共API,需订阅ChatGPT Plus等付费计划使用。OpenAI内部数据显示,工程师使用Codex后提交的拉取请求增加70%。官方强调,Codex-Max旨在辅助而非替代开发者,并通过沙盒环境和详细日志确保安全性和透明性。
原文链接
11月8日,OpenAI发布GPT-5-Codex-Mini,这是GPT-5-Codex的轻量版,专为经济高效编程设计。相比原版,Mini版性能小幅下降(SWE-bench测试得分71.3%,原版为74.5%),但开发者可获得约4倍使用额度。该模型适用于轻量级工程任务或接近速率上限场景,并已在CLI和IDE扩展中上线,API支持即将推出。此外,OpenAI优化了Codex后台,提升稳定性,避免流量波动影响体验。ChatGPT Plus等用户速率上限提高50%,Pro与Enterprise用户享有更快响应优先调度。
原文链接
加载更多
暂无内容