标题:Anthropic放大招:AI能像人一样操作电脑,你旁边看着就行
Anthropic近日发布了Claude 3.5的两项重大更新,包括Sonnet和Haiku两个版本。
Claude 3.5 Sonnet在编程方面表现突出,并新增了“计算机使用能力”,使AI能像人类一样操作电脑。例如,浏览网页、查找信息、填写表格、进行软件测试和开发等任务,AI都能自动完成。开发者只需下达指令,AI就能自动执行一系列操作,如搜索信息、填写表格和提交表单等。
Sonnet还展示了其在网页构建和本地修改方面的强大功能。它能自动下载文件并在编辑器中打开,分析问题并修复代码,成功启动服务器。此外,Sonnet还能帮助用户规划旅行,搜索合适地点、计算距离和设置日程提醒等。
Claude 3.5 Sonnet的工作原理涉及四个步骤:启动阶段、决策阶段、执行工具操作阶段和持续调用工具直至任务完成。虽然目前仍有一些限制,如鼠标滚轮、拖拽和缩放等操作尚有挑战,但Anthropic团队正不断改进。
Sonnet在多项基准测试中表现出色,包括编程和工具使用任务。它在SWE-bench Verified测试中的编程分数从33.4%提升到49.0%,超越所有公开可用的模型。同时,Sonnet的综合性能也得到了早期用户的高度评价。
Claude 3.5 Haiku是另一款性价比更高的模型,保持了与Claude 3 Haiku相同的成本和速度,但在编程任务上表现更佳,超过了多个前沿公开模型。Haiku还具备低延迟、改进的指令执行能力和更精确的工具使用能力,适用于多种应用场景。
这两项更新展示了Anthropic在AI领域的领先地位,不仅提升了AI的编程能力,还使其能像人类一样操作电脑,开启了新的技术应用前景。
原文链接
本文链接:https://kx.umi6.com/article/7731.html
转载请注明文章出处
相关推荐
换一换
DeepSeek又更新了!化身更强AI设计师、程序员 比肩全球最强代码生成器?
2025-03-25 09:48:08
Anthropic发布模型Opus 4.5,称其编程能力已超越人类工程师
2025-11-25 06:35:31
OpenAI内部模型曝光!编程能力跻身全球Top50程序员,年底不再有人类对手
2025-02-09 12:43:47
最强AI也跌落神坛 Claude Opus 4.7被指负升级:国内外都在喷
2026-04-17 15:06:53
GLM-5.1上线,编程表现贴Opus 4.6开大,Coding plan瞬间断货
2026-03-28 15:00:54
初探 Deepseek R1-0528 开源模型:AI 编程能力跃升,媲美 OpenAI o3 和 o4-mini
2025-05-29 10:08:36
OpenAI GPT-5 编程成绩有猫腻:自删 23 道测试题,关键基准还是自己提的
2025-08-12 13:18:21
GPT-5来了!人人都能免费用,最强大模型只需最傻瓜式使用
2025-08-08 04:01:37
OpenAI内部模型曝光:编程能力跻身全球Top50 年底超越任何人类
2025-02-09 23:55:42
实测GPT-5:写作坠入谷底,编程一骑绝尘
2025-08-08 09:11:19
GLM-5编程能力实测:新的全球第一 能超越Opus 4.6
2026-02-11 21:44:31
首个混合推理模型Claude 3.7发布!编程能力全面领先,还能控制思考时间
2025-02-25 15:56:21
编程权威榜单:千问3.7仅次于Claude,阿里全球第二
2026-05-26 14:30:08
684 文章
577844 浏览
24小时热文
更多
-
2026-06-09 00:54:40 -
2026-06-09 00:53:08 -
2026-06-08 23:49:41