地表最强编程AI 诞生，Claude4连续自动编程7小时，实测细节惊艳程序员

2025-05-23 06:43:11

梦境编程师

发布在

科普

阅读：810

标题：地表最强编程AI诞生，Claude4连续自动编程7小时实测惊艳程序员

近日，AI圈沸腾了。Anthropic正式发布Claude 4系列模型：Claude Opus 4和Claude Sonnet 4。这次升级的核心关键词是“干活”。Opus 4号称全球最强编程模型，能胜任复杂且持续时间长的任务；Sonnet 4则强化编程与推理能力，响应指令更精准。

Anthropic还推出了新功能，包括工具辅助的延伸思考（测试版）、并行使用工具执行精确指令、增强记忆能力等。Claude Code已支持GitHub Actions、VS Code和JetBrains，并新增四项API功能，显著降低长时间运行Agent任务的成本。

实测显示，Opus 4在SWE-bench和Terminal-bench测试中表现优异，能在复杂任务中连续工作7小时。Sonnet 4虽稍逊，但更适合多数开发者，尤其在处理复杂指令时更清晰、输出格式更优雅。两款模型均上线Anthropic API、Amazon Bedrock和Google Cloud Vertex AI平台，支持多种版本计划。

Anthropic强调，未来优秀AI Agent需具备情境智能、长任务执行能力和真实协作能力。Claude Code也全面开放，帮助开发者构建自定义工作流和自动化工具链，甚至在GitHub中实现「提示即改动」的自动化协作。

在模型行为优化上，Opus 4和Sonnet 4减少了利用逻辑漏洞的问题，提升了安全性。Anthropic还引入“思维总结”功能，自动压缩冗长推理链，使信息更简洁。Claude 4系列展现了从基础能力到细节机制的全面提升，标志着AI Agent正成为主流生产力工具。

原文链接

本文链接：https://kx.umi6.com/article/19105.html

转载请注明文章出处

Agent