1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:Anthropic放大招:AI能像人一样操作电脑,你旁边看着就行

Anthropic近日发布了Claude 3.5的两项重大更新,包括Sonnet和Haiku两个版本。

Claude 3.5 Sonnet在编程方面表现突出,并新增了“计算机使用能力”,使AI能像人类一样操作电脑。例如,浏览网页、查找信息、填写表格、进行软件测试和开发等任务,AI都能自动完成。开发者只需下达指令,AI就能自动执行一系列操作,如搜索信息、填写表格和提交表单等。

Sonnet还展示了其在网页构建和本地修改方面的强大功能。它能自动下载文件并在编辑器中打开,分析问题并修复代码,成功启动服务器。此外,Sonnet还能帮助用户规划旅行,搜索合适地点、计算距离和设置日程提醒等。

Claude 3.5 Sonnet的工作原理涉及四个步骤:启动阶段、决策阶段、执行工具操作阶段和持续调用工具直至任务完成。虽然目前仍有一些限制,如鼠标滚轮、拖拽和缩放等操作尚有挑战,但Anthropic团队正不断改进。

Sonnet在多项基准测试中表现出色,包括编程和工具使用任务。它在SWE-bench Verified测试中的编程分数从33.4%提升到49.0%,超越所有公开可用的模型。同时,Sonnet的综合性能也得到了早期用户的高度评价。

Claude 3.5 Haiku是另一款性价比更高的模型,保持了与Claude 3 Haiku相同的成本和速度,但在编程任务上表现更佳,超过了多个前沿公开模型。Haiku还具备低延迟、改进的指令执行能力和更精确的工具使用能力,适用于多种应用场景。

这两项更新展示了Anthropic在AI领域的领先地位,不仅提升了AI的编程能力,还使其能像人类一样操作电脑,开启了新的技术应用前景。

原文链接
本文链接:https://kx.umi6.com/article/7731.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
实测DeepSeek V3.1,不止拓展上下文长度
2025-08-20 17:21:15
拜拜Claude!阿里最强万亿模型编程秒了Opus4,实测在此
2025-09-06 12:37:03
DeepSeek又更新了!化身更强AI设计师、程序员 比肩全球最强代码生成器?
2025-03-25 09:48:08
初探 Deepseek R1-0528 开源模型:AI 编程能力跃升,媲美 OpenAI o3 和 o4-mini
2025-05-29 10:08:36
DeepSeek V3.1 Base突袭上线!击败Claude 4编程爆表,全网在蹲R2和V4
2025-08-21 10:27:32
实测低调上线的DeepSeek新模型:编程比Claude4还能打,写作...还是算了吧
2025-08-20 17:25:07
Claude4发布:替代人类程序员所需的条件,现在它都有了
2025-05-23 10:49:07
第一时间体验GPT-5,人人免费可用,马斯克表示不服
2025-08-08 06:03:18
o3来了!编程能力跻身人类全球前200,破解陶哲轩说难的数学测试,北大校友任泓宇现身直播间
2024-12-21 03:44:33
OpenAI内部模型曝光!编程能力跻身全球Top50程序员,年底不再有人类对手
2025-02-09 12:43:47
OpenAI内部模型曝光:编程能力跻身全球Top50 年底超越任何人类
2025-02-09 23:55:42
GPT-5来了!人人都能免费用,最强大模型只需最傻瓜式使用
2025-08-08 04:01:37
Claude 3.5深夜觉醒,学会模仿人类用电脑!编程干翻o1,Agent一夜变天
2024-10-24 11:06:19
24小时热文
更多
扫一扫体验小程序