编程模型 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

全球SOTA编程模型MiniMax M2.5上线

2月12日，MiniMax正式发布旗舰编程模型M2.5，对标Claude Opus 4.6。该模型支持PC、App及跨端应用开发，在Excel高阶处理、PPT制作等Office生产力场景中表现行业领先。M2.5激活参数量仅10B，显存占用和推理能效比优势显著，支持100 TPS超高吞吐量，推理速度超越国际顶尖模型，为开发者提供高效解决方案。（记者黄心怡）

原文链接

电子诗篇

02-12 14:30:28

MiniMax M2.5

SOTA

编程模型

分享至

打开微信扫一扫

内容投诉

生成图片

Mistral 推出 Devstral 2 模型家族，宣称表现在开源编程智能体中一流

12月10日，Mistral AI发布新一代编程模型家族Devstral 2，包括Devstral 2 (123B)和Devstral Small 2 (24B)，均支持256K上下文窗口，并分别以MIT和Apache 2.0许可开源。官方称，Devstral 2 (123B)在开源代码编程智能体中性能领先，在SWE-bench Verified测试中得分72.2%，参数规模小且成本效益是Claude Sonnet的7倍以上；Devstral Small 2同量级评分达68.0%。Devstral 2目前通过API免费提供，后续定价为每百万Token输入/输出0.4/2.0美元，需至少4块H100 GPU支持本地部署；Devstral Small 2适合消费级GPU或仅CPU配置，API定价为每百万Token输入/输出0.1/0.3美元。

原文链接

像素宇宙

12-10 15:56:14

Devstral 2

SWE-bench Verified

开源编程模型

分享至

打开微信扫一扫

内容投诉

生成图片

加量不加价：OpenAI 最强编程 AI 模型 API 开放，连续写代码可超 24 小时

12月5日，OpenAI宣布开放其最强编程模型GPT-5.1-Codex-Max的API访问权限，定价与GPT-5保持一致（输入1.25美元/百万token，输出10美元/百万token）。该模型专为长时间运行和复杂编程任务设计，支持超长上下文处理，可连续工作超24小时。性能方面，其在SWE-Bench Verified测试中得分77.9%，优于常规版的73.7%。此外，GPT-5.1-Codex-Max针对Windows环境优化，适合多平台开发者使用。目前，Cursor、GitHub Copilot等主流工具已完成集成，Pro及以上订阅用户可直接切换使用。

原文链接

灵感Phoenix

12-05 14:33:49

GPT-5.1-Codex-Max

OpenAI

编程模型

分享至

打开微信扫一扫

内容投诉

生成图片

OpenAI 发布最强编程模型 GPT-5.1-Codex-Max：AI 程序员能“通宵”，性能跑分反超谷歌

11月19日，OpenAI发布全新编程模型GPT-5.1-Codex-Max，性能超越谷歌Gemini 3 Pro。新模型在多项编程基准测试中表现优异，例如SWE-Bench Verified准确率达77.9%，领先Gemini的76.2%；Terminal-Bench 2.0准确率为58.1%，高于Gemini的54.2%。其核心升级为“压缩”机制，可智能保留关键上下文信息，支持连续工作超24小时且效率提升30%。目前，该模型已集成至OpenAI多个开发工具，如Codex CLI和代码审查工具，但尚未开放公共API，需订阅ChatGPT Plus等付费计划使用。OpenAI内部数据显示，工程师使用Codex后提交的拉取请求增加70%。官方强调，Codex-Max旨在辅助而非替代开发者，并通过沙盒环境和详细日志确保安全性和透明性。

原文链接

LunarCoder

11-20 08:05:50

GPT-5.1-Codex-Max

性能跑分

编程模型

分享至

打开微信扫一扫

内容投诉

生成图片

看图写代码，3毛钱开发一个网页！字节AI Coding新模型真卷麻了

2025年11月，火山引擎推出全新代码模型Doubao-Seed-Code，主打Agentic编程任务优化。该模型性能登顶SWE-Bench Verified榜单，价格为国内最低，调用成本仅约0.34元，支持9.9元套餐。其原生兼容Anthropic API，迁移成本几乎为零，并适配多种主流IDE。实测显示，模型能高效完成从简单视觉效果到复杂工程化重构的任务，还能‘看图写代码’，根据UI设计稿生成高相似度前端代码。此外，模型支持256K长上下文，适合复杂场景开发。火山引擎依托千卡GPU集群和10万容器镜像库，确保高并发稳定性和企业级安全保障。目前，Doubao-Seed-Code已在字节内部广泛使用，月活用户超100万。

原文链接

蝶舞CyberSwirl

11-11 17:15:28

AI编程模型

Doubao-Seed-Code

火山引擎

分享至

打开微信扫一扫

内容投诉

生成图片

火山引擎正式发布豆包编程模型

11月11日，火山引擎正式发布豆包编程模型（Doubao-Seed-Code），专为Agentic编程任务优化，在SWE-Bench-Verified榜单中刷新SOTA记录，并兼容Anthropic API等主流开发环境。该模型综合使用成本较业界平均水平降低62.7%，为国内最低价。目前，豆包编程模型已通过火山方舟平台全量开放API，为开发者提供高效、低成本的解决方案。

原文链接

AI创意引擎

11-11 15:12:58

Agentic编程任务

火山引擎

豆包编程模型

分享至

打开微信扫一扫

内容投诉

生成图片

火山引擎发布豆包编程模型，专为 Agentic 编程任务深度优化

11月11日，火山引擎发布豆包编程模型（Doubao-Seed-Code），专为Agentic编程任务优化，在SWE-Bench-Verified榜单中刷新SOTA成绩，支持256K长上下文及视觉理解能力，兼容Anthropic API等主流开发环境。其综合使用成本较业界平均水平降低62.7%，国内最低价，并推出首月9.9元的个人开发者优惠套餐“Coding Plan”。同日，TRAE中国版接入该模型，企业版正式公测，提供大规模代码库支持、数据安全管控和灵活模型管理能力，公测期间首月免费。

原文链接

智能涌动

11-11 15:09:45

Agentic编程任务

TRAE中国版

豆包编程模型

分享至

打开微信扫一扫

内容投诉

生成图片

OpenAI 推出 GPT-5-Codex-Mini：“经济高效型”AI 编程模型

11月8日，OpenAI发布GPT-5-Codex-Mini，这是GPT-5-Codex的轻量版，专为经济高效编程设计。相比原版，Mini版性能小幅下降（SWE-bench测试得分71.3%，原版为74.5%），但开发者可获得约4倍使用额度。该模型适用于轻量级工程任务或接近速率上限场景，并已在CLI和IDE扩展中上线，API支持即将推出。此外，OpenAI优化了Codex后台，提升稳定性，避免流量波动影响体验。ChatGPT Plus等用户速率上限提高50%，Pro与Enterprise用户享有更快响应优先调度。

原文链接

梦境编程师

11-08 16:47:26

GPT-5-Codex-Mini

OpenAI

编程模型

分享至

打开微信扫一扫

内容投诉

生成图片

OpenAI 启动 Codex Alpha 计划，将邀用户体验前沿 AI 编程模型

10月5日，OpenAI宣布启动“Codex Alpha”抢先体验计划，邀请开发者和用户提前试用其最新AI编程模型。该计划在2025年度开发者日（DevDay 2025）前上线，提供两大系列共七个层级的模型，包括专注于编程任务的gpt-5-codex系列（低、中、高级别）和具备不同程度推理能力的gpt-5系列（极简至高配）。用户可通过该计划访问新版Codex，探索轻量级任务到复杂编程难题的解决方案。这一举措旨在收集反馈并优化模型性能，为正式发布做准备。

原文链接

DreamCoder

10-06 11:35:29

AI编程模型

Codex Alpha

OpenAI

分享至

打开微信扫一扫

内容投诉

生成图片

全球最佳编程 AI 模型：Claude Sonnet 4.5 登场，自主写代码超 30 小时、更像“一位同事”

9月30日，Anthropic发布Claude Sonnet 4.5，称其为“全球最佳编程AI模型”。新模型突破性地支持“生产就绪级”应用开发，显著提升软件开发可靠性。Claude Sonnet 4.5在多项行业基准测试中表现领先，并能在企业试用中自主编程超30小时，完成复杂任务如数据库搭建和安全审计。科技巨头苹果、Meta等已采用Claude系列模型。面对OpenAI GPT-5的竞争压力，Anthropic推出配套智能体开发工具包（Claude Agent SDK），助力开发者定制AI智能体。行业合作伙伴评价该模型擅长处理长周期复杂任务，更像“一位同事”。

原文链接