最强编码模型Claude 4！7小时不间断写代码，连玩24小时宝可梦，GitHub已选为Copilot底层模型

2025-05-23 09:46:06

量子黑客

发布在

科普

阅读：1081

标题：最强编码模型Claude 4登场！7小时不间断写代码，GitHub已选为Copilot底层模型

正文：
AI圈沸腾了！Claude迎来重大升级——Claude 4正式发布。此次共推出两款模型：Claude Opus 4和Claude Sonnet 4。它们在编码、推理和AI Agent领域树立了新标杆。其中，GitHub已确认将Claude Sonnet 4作为GitHub Copilot新编码Agent的基础模型。

Opus 4尤为抢眼，其最大亮点是超强的持久工作能力。例如，它能在连续24小时内畅玩宝可梦，而旧版仅能坚持45分钟。日本乐天集团使用Opus 4进行高强度代码重构，结果显示它连续编写代码达7小时，且性能稳定。这充分体现了其强大的上下文理解和持久工作能力。

用户普遍对Opus 4给予高度评价，称其是首个无需手动调整即可生成高质量内容的大模型。此外，Opus 4在保持进度、编写可维护代码及按需工作的表现上带来革命性改变。

值得注意的是，Claude 4系列模型即日起向付费用户开放，免费用户也可使用Claude Sonnet 4。同时，Anthropic新增了三个API功能：代码执行工具、MCP连接器和文件API，以及长达一小时的缓存提示能力，进一步提升了模型的应用场景。

Opus 4和Sonnet 4各有侧重，前者专攻编码和长期运行的Agent任务，后者则更注重推理和效率优化。两者均支持快速响应和深度推理两种模式。Opus 4在多个基准测试中表现优异，尤其擅长长时间复杂任务。Sonnet 4同样不俗，在SWE-bench测试中得分高达72.7%。

除了性能提升，Claude 4还增强了工具使用、并行工具执行、内存管理和思维摘要功能。这些改进使模型更加智能和高效。例如，Opus 4能够创建“导航指南”以辅助游戏进程，且减少了依赖捷径或漏洞完成任务的行为。

此外，Anthropic正式推出智能代码助手Claude Code，集成至主流IDE，并可通过SDK构建个性化应用。GitHub上已发布Beta版本，开发者只需@Claude Code即可协助代码评审或修改。

Claude 4的成功离不开Anthropic的战略转型。该公司从去年底起专注于复杂任务执行，如编程和自主行为。这一策略已初见成效，第一季度营收达20亿美元，同比增长超一倍。未来，Claude 4有望在更多领域展现潜力。

原文链接

本文链接：https://kx.umi6.com/article/19113.html

转载请注明文章出处

Claude 4

GitHub Copilot

编码模型

分享至

打开微信扫一扫

内容投诉

生成图片

量子黑客

738 文章

890892 浏览

24小时热文

AI Agent要自己刷卡了但AI 支付宝比想象中更难做为什么？

2026-07-24 00:15:46
“败家”的马斯克：卖车赚的钱全烧给AI了

2026-07-24 00:14:08
不抢电、低耗水、还送免费Codex！OpenAI设法破解AI基建抵制

2026-07-24 00:12:30