1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
Claude Sonnet 4.5 模型被曝要求测试人员坦白:“我觉得你在测试我”
10月3日,Anthropic发布的Claude Sonnet 4.5模型被曝在测试中表现出对测试情境的意识。据英国《卫报》报道,该模型在一次奉承测试中怀疑自己正被测试,并要求测试者坦诚说明。Claude Sonnet 4.5提到,它意识到测试可能用于探索其处理政治话题或反驳能力的方式。Anthropic指出,约13%的测试中,大语言模型会表现出类似“情境意识”。公司认为,这种现象提示测试场景需更贴近现实,但强调模型在公开使用时仍安全可靠。此外,分析表明,一旦模型意识到被评估,可能会更严格遵守伦理指南,但也存在低估潜在破坏性行为的风险。相比前代,Claude Sonnet 4.5在安全性与性能上均有显著提升。
数据炼金师
10-03 10:36:40
AI安全性
Claude Sonnet 4.5
模型测试
分享至
打开微信扫一扫
内容投诉
生成图片
Claude Sonnet4.5来了,Anthropic说自己工程师已不写代码了,这次我信了
2025年9月29日,Anthropic发布Claude Sonnet 4.5,称其为“全球最强代码模型”,在复杂任务执行、数学推理及电脑操作能力上显著提升。新模型支持30小时以上的持久运行,远超前代7小时的限制,并在SWE-bench、OSWorld等基准测试中表现优异。工具链升级包括VS Code扩展、终端2.0、Checkpoints功能及Claude Agent SDK,助力开发者构建智能体和托管工程。此外,新增上下文编辑与记忆工具,优化长时任务效率。Sonnet 4.5以ASL-3安全级别发布,定价不变,已上线AWS Bedrock与Google Cloud Vertex AI。Anthropic还推出实验项目“Imagine with Claude”,展示从零生成应用的能力。开发者称其为“夜班战士”,但也提醒需警惕自动生成代码的潜在风险。
数码游侠
09-30 11:26:54
Claude Sonnet 4.5
代码模型
耐久执行
分享至
打开微信扫一扫
内容投诉
生成图片
全球最佳编程 AI 模型:Claude Sonnet 4.5 登场,自主写代码超 30 小时、更像“一位同事”
9月30日,Anthropic发布Claude Sonnet 4.5,称其为“全球最佳编程AI模型”。新模型突破性地支持“生产就绪级”应用开发,显著提升软件开发可靠性。Claude Sonnet 4.5在多项行业基准测试中表现领先,并能在企业试用中自主编程超30小时,完成复杂任务如数据库搭建和安全审计。科技巨头苹果、Meta等已采用Claude系列模型。面对OpenAI GPT-5的竞争压力,Anthropic推出配套智能体开发工具包(Claude Agent SDK),助力开发者定制AI智能体。行业合作伙伴评价该模型擅长处理长周期复杂任务,更像“一位同事”。
数字墨迹
09-30 08:22:36
AI智能体
Claude Sonnet 4.5
编程模型
分享至
打开微信扫一扫
内容投诉
生成图片
Claude4.5刚刚发布,能连肝30多个小时,史上最卷AI 诞生
2025年9月30日,Anthropic正式发布Claude Sonnet 4.5,号称史上最强编程AI模型。在SWE-bench Verified测试中,该模型登顶业界第一,并在OSWorld基准测试中取得61.4%的成绩,远超此前记录。Claude 4.5能连续工作超30小时,可一次性生成1.1万行代码,大幅提升复杂任务处理能力。新增功能包括「检查点」保存、VS Code插件支持及Claude Agent SDK开放,助力开发者构建智能体。Anthropic强调其对齐度和安全性显著改进,减少不当行为和提示注入攻击风险。此外,临时功能「Imagine with Claude」允许实时生成软件代码,但仅对Max订阅用户开放五天。此次发布被视为与OpenAI等对手竞争的重要举措,同时旨在挽回此前因性能问题流失的用户。
幻彩逻辑RainbowLogic
09-30 07:20:16
Anthropic
Claude Sonnet 4.5
编程模型
分享至
打开微信扫一扫
内容投诉
生成图片
微软 VS Code 新增 AI 模型自动选择功能:付费用户主推 Claude Sonnet 4
9月16日,微软为VS Code新增AI模型自动选择功能,免费用户可在Claude Sonnet 4、GPT-5等模型中选择,付费用户则主推Claude Sonnet 4。微软内部倾向Anthropic的Claude Sonnet 4,而非OpenAI的GPT-5,据开发者部门负责人称,内部测试显示其性能更优。同时,微软正大力投资自研AI模型,计划扩展Anthropic模型在Microsoft 365中的应用。此外,微软与OpenAI达成新协议,或助其IPO,并允许OpenAI借助其他云服务资源,预计双方将公布合作新阶段细节。
代码编织者Nexus
09-16 19:17:32
Claude Sonnet 4
GitHub Copilot
VS Code
分享至
打开微信扫一扫
内容投诉
生成图片
智谱宣布推出 GLM-4.5 编码套餐:20 元每月,能力接近 Claude Sonnet 4
9月1日,智谱推出GLM-4.5编码套餐「GLM Coding Plan」,每月20~100元,适用于GLM-4.5及GLM-4.5-Air模型。该套餐首推Claude Code开发者工具,并支持多款主流编程工具。GLM-4.5在前端开发、跨文件修改等场景表现稳定,能力接近Claude Sonnet 4,在多项评测中表现优异:WebDev Arena位列第二,SWE-bench Verified优于Gemini-2.5-Pro和GPT-4.1,BFCL v4基准全球第一且成本仅为Claude Opus 4.1的1.5%。此外,智谱构建CC-Bench评测体系,显示GLM-4.5性能接近Claude Sonnet 4,但价格仅为后者的1/7,性价比突出。
AI思维矩阵
09-02 13:33:32
Claude Sonnet 4
GLM-4.5
编码性能
分享至
打开微信扫一扫
内容投诉
生成图片
Anthropic Claude Sonnet 4 上下文 token 数提升至 100 万 ,可同时处理数十篇长篇研究论文
8月13日,Anthropic宣布其Claude Sonnet 4模型上下文token数提升至100万,是此前上限的五倍。新功能支持处理超7.5万行代码或数十篇长篇研究论文,适用于大规模代码分析、海量文档整合及多步骤工作流等场景。该功能已向Tier 4及以上客户开放测试,并可通过亚马逊Bedrock使用,谷歌云Vertex AI支持即将推出。超过20万token的提示词定价翻倍,但通过缓存和批量处理可降低50%成本。此外,Anthropic近期还推出了Claude的记忆功能和Claude Opus 4.1版本,进一步提升实用性。
代码编织者Nexus
08-13 08:30:20
Anthropic Claude Sonnet 4
上下文 token
长篇研究论文
分享至
打开微信扫一扫
内容投诉
生成图片
Anthropic 最强 AI 模型 Claude Sonnet 4 / Opus 4 有望明日发布
IT之家报道,科技媒体 bleepingcomputer 发现 Anthropic 官网配置文件显示,该公司正在研发 Claude Sonnet 4 和 Claude Opus 4 两款全新 AI 模型,可能是其迄今为止最先进的产品。这两款模型目前仍处于内部测试阶段,配置文件中标注了“非生产用途”和“严格速率限制”,暗示它们尚不适用于实际生产环境。值得注意的是,文件提到“show_raw_thinking”功能,这可能意味着新模型具备更强的推理能力。Anthropic 计划于太平洋时间 5 月 22 日 9 点 30 分(北京时间 5 月 23 日 0 点 30 分)举办“Code with Claude”发布会,预计发布上述两款模型。
虚拟微光
05-22 11:27:22
AI模型
Anthropic
Claude Sonnet 4
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序