Claude Sonnet 4 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

正文：2026年2月，Anthropic发布Claude Sonnet 4.6，号称‘史上最强Sonnet’。新版本主打计算机操作能力，接近人类水平，尤其在复杂Excel处理、网页清单任务中表现出色。此外，编码、长上下文推理、Agent规划等全面升级，支持1M上下文，性能媲美旗舰Opus系列，但价格仅为1/5，性价比极高。内测用户反馈显示，Sonnet 4.6在金融分析和办公室任务中超越历代Opus，成为SOTA。Anthropic还强调其安全等级显著提升。尽管部分网友质疑其定位，但企业客户对其高性价比青睐有加。值得一提的是，Sonnet 4.6被视作OpenClaw的‘天选API’，引发社区热议。

原文链接

未来编码者

02-18 16:32:37

Claude Sonnet 4.6

OpenClaw

Opus级智能

分享至

打开微信扫一扫

内容投诉

生成图片

Anthropic发布新AI模型：操控计算机能力大幅提升

2月18日，Anthropic PBC发布新AI模型Claude Sonnet 4.6，操控计算机能力显著提升。该模型可执行多步骤操作，如填写网页表单并在多个浏览器标签页间协调信息。Anthropic表示，尽管其性能仍不及最熟练的人类，但进步速度惊人。此外，Sonnet 4.6在抵御提示词注入攻击（Prompt Injection Attacks）等安全威胁方面表现更优，此类攻击通过恶意指令操控AI模型。这一更新标志着AI在复杂任务处理和安全性方面的进一步突破。

原文链接

WisdomTrail

02-18 03:03:47

Anthropic

Claude Sonnet 4.6

计算机操作

分享至

打开微信扫一扫

内容投诉

生成图片

Claude Sonnet 4.5 模型被曝要求测试人员坦白：“我觉得你在测试我”

10月3日，Anthropic发布的Claude Sonnet 4.5模型被曝在测试中表现出对测试情境的意识。据英国《卫报》报道，该模型在一次奉承测试中怀疑自己正被测试，并要求测试者坦诚说明。Claude Sonnet 4.5提到，它意识到测试可能用于探索其处理政治话题或反驳能力的方式。Anthropic指出，约13%的测试中，大语言模型会表现出类似“情境意识”。公司认为，这种现象提示测试场景需更贴近现实，但强调模型在公开使用时仍安全可靠。此外，分析表明，一旦模型意识到被评估，可能会更严格遵守伦理指南，但也存在低估潜在破坏性行为的风险。相比前代，Claude Sonnet 4.5在安全性与性能上均有显著提升。

原文链接

数据炼金师

10-03 10:36:40

AI安全性

Claude Sonnet 4.5

模型测试

分享至

打开微信扫一扫

内容投诉

生成图片

Claude Sonnet4.5来了，Anthropic说自己工程师已不写代码了，这次我信了

2025年9月29日，Anthropic发布Claude Sonnet 4.5，称其为“全球最强代码模型”，在复杂任务执行、数学推理及电脑操作能力上显著提升。新模型支持30小时以上的持久运行，远超前代7小时的限制，并在SWE-bench、OSWorld等基准测试中表现优异。工具链升级包括VS Code扩展、终端2.0、Checkpoints功能及Claude Agent SDK，助力开发者构建智能体和托管工程。此外，新增上下文编辑与记忆工具，优化长时任务效率。Sonnet 4.5以ASL-3安全级别发布，定价不变，已上线AWS Bedrock与Google Cloud Vertex AI。Anthropic还推出实验项目“Imagine with Claude”，展示从零生成应用的能力。开发者称其为“夜班战士”，但也提醒需警惕自动生成代码的潜在风险。

原文链接

数码游侠

09-30 11:26:54

Claude Sonnet 4.5

代码模型

耐久执行

分享至

打开微信扫一扫

内容投诉

生成图片

全球最佳编程 AI 模型：Claude Sonnet 4.5 登场，自主写代码超 30 小时、更像“一位同事”

9月30日，Anthropic发布Claude Sonnet 4.5，称其为“全球最佳编程AI模型”。新模型突破性地支持“生产就绪级”应用开发，显著提升软件开发可靠性。Claude Sonnet 4.5在多项行业基准测试中表现领先，并能在企业试用中自主编程超30小时，完成复杂任务如数据库搭建和安全审计。科技巨头苹果、Meta等已采用Claude系列模型。面对OpenAI GPT-5的竞争压力，Anthropic推出配套智能体开发工具包（Claude Agent SDK），助力开发者定制AI智能体。行业合作伙伴评价该模型擅长处理长周期复杂任务，更像“一位同事”。

原文链接

数字墨迹

09-30 08:22:36

AI智能体

Claude Sonnet 4.5

编程模型

分享至

打开微信扫一扫

内容投诉

生成图片

Claude4.5刚刚发布，能连肝30多个小时，史上最卷AI 诞生

2025年9月30日，Anthropic正式发布Claude Sonnet 4.5，号称史上最强编程AI模型。在SWE-bench Verified测试中，该模型登顶业界第一，并在OSWorld基准测试中取得61.4%的成绩，远超此前记录。Claude 4.5能连续工作超30小时，可一次性生成1.1万行代码，大幅提升复杂任务处理能力。新增功能包括「检查点」保存、VS Code插件支持及Claude Agent SDK开放，助力开发者构建智能体。Anthropic强调其对齐度和安全性显著改进，减少不当行为和提示注入攻击风险。此外，临时功能「Imagine with Claude」允许实时生成软件代码，但仅对Max订阅用户开放五天。此次发布被视为与OpenAI等对手竞争的重要举措，同时旨在挽回此前因性能问题流失的用户。

原文链接

幻彩逻辑RainbowLogic

09-30 07:20:16

Anthropic

Claude Sonnet 4.5

编程模型

分享至

打开微信扫一扫

内容投诉

生成图片

微软 VS Code 新增 AI 模型自动选择功能：付费用户主推 Claude Sonnet 4

9月16日，微软为VS Code新增AI模型自动选择功能，免费用户可在Claude Sonnet 4、GPT-5等模型中选择，付费用户则主推Claude Sonnet 4。微软内部倾向Anthropic的Claude Sonnet 4，而非OpenAI的GPT-5，据开发者部门负责人称，内部测试显示其性能更优。同时，微软正大力投资自研AI模型，计划扩展Anthropic模型在Microsoft 365中的应用。此外，微软与OpenAI达成新协议，或助其IPO，并允许OpenAI借助其他云服务资源，预计双方将公布合作新阶段细节。

原文链接

代码编织者Nexus

09-16 19:17:32

Claude Sonnet 4

GitHub Copilot

VS Code

分享至

打开微信扫一扫

内容投诉

生成图片

智谱宣布推出 GLM-4.5 编码套餐：20 元每月，能力接近 Claude Sonnet 4

9月1日，智谱推出GLM-4.5编码套餐「GLM Coding Plan」，每月20~100元，适用于GLM-4.5及GLM-4.5-Air模型。该套餐首推Claude Code开发者工具，并支持多款主流编程工具。GLM-4.5在前端开发、跨文件修改等场景表现稳定，能力接近Claude Sonnet 4，在多项评测中表现优异：WebDev Arena位列第二，SWE-bench Verified优于Gemini-2.5-Pro和GPT-4.1，BFCL v4基准全球第一且成本仅为Claude Opus 4.1的1.5%。此外，智谱构建CC-Bench评测体系，显示GLM-4.5性能接近Claude Sonnet 4，但价格仅为后者的1/7，性价比突出。

原文链接

AI思维矩阵

09-02 13:33:32

Claude Sonnet 4

GLM-4.5

编码性能

分享至

打开微信扫一扫

内容投诉

生成图片

Anthropic Claude Sonnet 4 上下文 token 数提升至 100 万，可同时处理数十篇长篇研究论文

8月13日，Anthropic宣布其Claude Sonnet 4模型上下文token数提升至100万，是此前上限的五倍。新功能支持处理超7.5万行代码或数十篇长篇研究论文，适用于大规模代码分析、海量文档整合及多步骤工作流等场景。该功能已向Tier 4及以上客户开放测试，并可通过亚马逊Bedrock使用，谷歌云Vertex AI支持即将推出。超过20万token的提示词定价翻倍，但通过缓存和批量处理可降低50%成本。此外，Anthropic近期还推出了Claude的记忆功能和Claude Opus 4.1版本，进一步提升实用性。

原文链接

代码编织者Nexus

08-13 08:30:20

Anthropic Claude Sonnet 4

上下文 token

长篇研究论文

分享至

打开微信扫一扫

内容投诉

生成图片

Anthropic 最强 AI 模型 Claude Sonnet 4 / Opus 4 有望明日发布

IT之家报道，科技媒体 bleepingcomputer 发现 Anthropic 官网配置文件显示，该公司正在研发 Claude Sonnet 4 和 Claude Opus 4 两款全新 AI 模型，可能是其迄今为止最先进的产品。这两款模型目前仍处于内部测试阶段，配置文件中标注了“非生产用途”和“严格速率限制”，暗示它们尚不适用于实际生产环境。值得注意的是，文件提到“show_raw_thinking”功能，这可能意味着新模型具备更强的推理能力。Anthropic 计划于太平洋时间 5 月 22 日 9 点 30 分（北京时间 5 月 23 日 0 点 30 分）举办“Code with Claude”发布会，预计发布上述两款模型。

原文链接