标题:最强编码模型Claude 4登场!7小时不间断写代码,GitHub已选为Copilot底层模型
正文:
AI圈沸腾了!Claude迎来重大升级——Claude 4正式发布。此次共推出两款模型:Claude Opus 4和Claude Sonnet 4。它们在编码、推理和AI Agent领域树立了新标杆。其中,GitHub已确认将Claude Sonnet 4作为GitHub Copilot新编码Agent的基础模型。
Opus 4尤为抢眼,其最大亮点是超强的持久工作能力。例如,它能在连续24小时内畅玩宝可梦,而旧版仅能坚持45分钟。日本乐天集团使用Opus 4进行高强度代码重构,结果显示它连续编写代码达7小时,且性能稳定。这充分体现了其强大的上下文理解和持久工作能力。
用户普遍对Opus 4给予高度评价,称其是首个无需手动调整即可生成高质量内容的大模型。此外,Opus 4在保持进度、编写可维护代码及按需工作的表现上带来革命性改变。
值得注意的是,Claude 4系列模型即日起向付费用户开放,免费用户也可使用Claude Sonnet 4。同时,Anthropic新增了三个API功能:代码执行工具、MCP连接器和文件API,以及长达一小时的缓存提示能力,进一步提升了模型的应用场景。
Opus 4和Sonnet 4各有侧重,前者专攻编码和长期运行的Agent任务,后者则更注重推理和效率优化。两者均支持快速响应和深度推理两种模式。Opus 4在多个基准测试中表现优异,尤其擅长长时间复杂任务。Sonnet 4同样不俗,在SWE-bench测试中得分高达72.7%。
除了性能提升,Claude 4还增强了工具使用、并行工具执行、内存管理和思维摘要功能。这些改进使模型更加智能和高效。例如,Opus 4能够创建“导航指南”以辅助游戏进程,且减少了依赖捷径或漏洞完成任务的行为。
此外,Anthropic正式推出智能代码助手Claude Code,集成至主流IDE,并可通过SDK构建个性化应用。GitHub上已发布Beta版本,开发者只需@Claude Code即可协助代码评审或修改。
Claude 4的成功离不开Anthropic的战略转型。该公司从去年底起专注于复杂任务执行,如编程和自主行为。这一策略已初见成效,第一季度营收达20亿美元,同比增长超一倍。未来,Claude 4有望在更多领域展现潜力。
.png)

-
2025-07-19 10:50:54
-
2025-07-19 09:50:33
-
2025-07-19 07:49:30