1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:Anthropic放大招:AI能像人一样操作电脑,你旁边看着就行

Anthropic近日发布了Claude 3.5的两项重大更新,包括Sonnet和Haiku两个版本。

Claude 3.5 Sonnet在编程方面表现突出,并新增了“计算机使用能力”,使AI能像人类一样操作电脑。例如,浏览网页、查找信息、填写表格、进行软件测试和开发等任务,AI都能自动完成。开发者只需下达指令,AI就能自动执行一系列操作,如搜索信息、填写表格和提交表单等。

Sonnet还展示了其在网页构建和本地修改方面的强大功能。它能自动下载文件并在编辑器中打开,分析问题并修复代码,成功启动服务器。此外,Sonnet还能帮助用户规划旅行,搜索合适地点、计算距离和设置日程提醒等。

Claude 3.5 Sonnet的工作原理涉及四个步骤:启动阶段、决策阶段、执行工具操作阶段和持续调用工具直至任务完成。虽然目前仍有一些限制,如鼠标滚轮、拖拽和缩放等操作尚有挑战,但Anthropic团队正不断改进。

Sonnet在多项基准测试中表现出色,包括编程和工具使用任务。它在SWE-bench Verified测试中的编程分数从33.4%提升到49.0%,超越所有公开可用的模型。同时,Sonnet的综合性能也得到了早期用户的高度评价。

Claude 3.5 Haiku是另一款性价比更高的模型,保持了与Claude 3 Haiku相同的成本和速度,但在编程任务上表现更佳,超过了多个前沿公开模型。Haiku还具备低延迟、改进的指令执行能力和更精确的工具使用能力,适用于多种应用场景。

这两项更新展示了Anthropic在AI领域的领先地位,不仅提升了AI的编程能力,还使其能像人类一样操作电脑,开启了新的技术应用前景。

原文链接
本文链接:https://kx.umi6.com/article/7731.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
GPT-5泄露!首次统一GPT和o系列,实测demo抢先曝光,下周发布?
2025-08-01 08:52:52
DeepSeek V4爆料:春节档GPT/Claude编程危
2026-01-10 10:03:27
实测低调上线的DeepSeek新模型:编程比Claude4还能打,写作...还是算了吧
2025-08-20 17:25:07
Claude4发布:替代人类程序员所需的条件,现在它都有了
2025-05-23 10:49:07
DeepSeek V3.1 Base突袭上线!击败Claude 4编程爆表,全网在蹲R2和V4
2025-08-21 10:27:32
Anthropic发布AI代理 会用计算机做复杂任务
2024-10-23 02:20:43
OpenAI内部模型曝光!编程能力跻身全球Top50程序员,年底不再有人类对手
2025-02-09 12:43:47
Anthropic发布模型Opus 4.5,称其编程能力已超越人类工程师
2025-11-25 06:35:31
OpenAI内部模型曝光:编程能力跻身全球Top50 年底超越任何人类
2025-02-09 23:55:42
OpenAI GPT-5 编程成绩有猫腻:自删 23 道测试题,关键基准还是自己提的
2025-08-12 13:18:21
Anthropic放大招:AI能像人一样操作电脑,你旁边看着就行
2024-10-23 11:34:20
Claude 3.5深夜觉醒,学会模仿人类用电脑!编程干翻o1,Agent一夜变天
2024-10-24 11:06:19
第一时间体验GPT-5,人人免费可用,马斯克表示不服
2025-08-08 06:03:18
24小时热文
更多
扫一扫体验小程序