标题:Claude自动玩崩铁清日常,NUS新论文完整测评AI电脑操控
正文: 新加坡国立大学团队测试了Claude在20多个场景下的表现,其中最吸引人的是AI能自动玩手游并完成日常任务。研究中选用米哈游的《崩坏:星穹铁道》,只需对Claude说“帮我完成今天的模拟宇宙”,它就能自动打开游戏菜单、找到“黄金花萼”、设置挑战次数,并启动自动战斗。
这项技术不仅限于游戏,Claude还能智能理解规则和目标,在不同任务间灵活调整。它还展示了在网页搜索、办公软件操作等方面的强大能力,如在Amazon和Apple官网下单购物、在Apple Music添加歌曲、编辑Excel数据等。
Claude Computer Use的潜力远未被完全挖掘。该系统基于API设计了一个自动化GUI框架,分为系统提示、状态观察、推理范式、工具使用、GUI动作空间和历史视觉上下文维护六个部分。团队设计了详尽的测试实验,涵盖了网页搜索、工作流程、办公生产力和视频游戏等多个领域。
尽管Claude在某些复杂操作中偶尔失败,比如未能正确导航到特定网页选项卡或准确选择文本字段,但整体表现令人印象深刻。团队已公开所有测试用例的具体信息,未来值得期待。
参考资料: https://arxiv.org/pdf/2411.10323 https://github.com/showlab/computer_use_ootb
原文链接
本文链接:https://kx.umi6.com/article/9520.html
转载请注明文章出处
相关推荐
.png)
换一换
Anthropic 推动“AI 进校园”计划,将为高校师生提供定制版 Claude
2025-04-03 16:29:57
Anthropic对苹果Siri发起致命一击
2025-05-29 15:40:29
亚马逊 2 月 26 日发布新一代 Alexa 生成式 AI 服务,使用 Claude 模型
2025-02-06 07:22:32
新研究揭穿Claude底裤,马斯克盖棺定论
2025-10-23 15:05:55
Claude编程支持一键共享,第一批网友已经开始晒作品了
2024-07-10 16:00:00
新版Claude曝光:“极限推理”成最大亮点
2025-05-16 13:41:49
性能提升 90%,Anthropic 首次公开多智能体系统构建全流程
2025-06-16 15:09:20
Llama惨遭抛弃!Meta内部改用Claude写代码
2025-07-11 09:32:54
Claude重磅升级,可以像人一样控制电脑了!
2024-10-23 02:19:41
ChatGPT和Claude,已经不是同一条路上的玩家了
2025-09-17 18:33:53
AI 聊天机器人 Claude 新增跨平台记忆:用户度假归来可追溯上周聊天记录
2025-08-12 10:14:40
谷歌被曝正使用 Anthropic 的 Claude 模型来改进其 Gemini AI
2024-12-25 09:58:28
Claude 创始人:AI 全面超越人类,只剩 2-3 年
2025-01-22 23:06:39
522 文章
278538 浏览
24小时热文
更多

-
2025-10-23 18:14:34
-
2025-10-23 18:13:26
-
2025-10-23 18:12:20