标题:Claude自动玩崩铁清日常,NUS新论文完整测评AI电脑操控
正文: 新加坡国立大学团队测试了Claude在20多个场景下的表现,其中最吸引人的是AI能自动玩手游并完成日常任务。研究中选用米哈游的《崩坏:星穹铁道》,只需对Claude说“帮我完成今天的模拟宇宙”,它就能自动打开游戏菜单、找到“黄金花萼”、设置挑战次数,并启动自动战斗。
这项技术不仅限于游戏,Claude还能智能理解规则和目标,在不同任务间灵活调整。它还展示了在网页搜索、办公软件操作等方面的强大能力,如在Amazon和Apple官网下单购物、在Apple Music添加歌曲、编辑Excel数据等。
Claude Computer Use的潜力远未被完全挖掘。该系统基于API设计了一个自动化GUI框架,分为系统提示、状态观察、推理范式、工具使用、GUI动作空间和历史视觉上下文维护六个部分。团队设计了详尽的测试实验,涵盖了网页搜索、工作流程、办公生产力和视频游戏等多个领域。
尽管Claude在某些复杂操作中偶尔失败,比如未能正确导航到特定网页选项卡或准确选择文本字段,但整体表现令人印象深刻。团队已公开所有测试用例的具体信息,未来值得期待。
参考资料: https://arxiv.org/pdf/2411.10323 https://github.com/showlab/computer_use_ootb
原文链接
本文链接:https://kx.umi6.com/article/9520.html
转载请注明文章出处
相关推荐
换一换
Claude估值暴涨300%!全球独角兽字节第三他第四
2025-09-03 12:44:37
新研究揭穿Claude底裤,马斯克盖棺定论
2025-10-23 15:05:55
LMArena排行榜:Claude、GPT-5、智谱GLM-4.6排名并列全球第一
2025-11-13 21:22:57
Claude自动玩崩铁清日常,NUS新论文完整测评AI电脑操控
2024-12-01 19:35:41
Claude公司估值615亿美元再融35亿,那DeepSeek…
2025-03-04 21:30:42
Claude网页版接入MCP!10款应用一键调用,开发者30分钟可创建新集成
2025-05-02 19:05:54
亚马逊 2 月 26 日发布新一代 Alexa 生成式 AI 服务,使用 Claude 模型
2025-02-06 07:22:32
Claude编程支持一键共享,第一批网友已经开始晒作品了
2024-07-10 16:00:00
Anthropic 推出新功能:用户可直接在 Claude 聊天机器人中构建 AI 驱动应用
2025-06-26 07:37:47
美国AI巨头Anthropic全球封杀中国控股公司!无论何地一律禁用Claude等
2025-09-05 18:23:30
Anthropic对苹果Siri发起致命一击
2025-05-29 15:40:29
OpenAI离职到估值千亿美元,Anthropic4年时间引硅谷巨头疯狂押注
2025-08-01 08:54:00
Anthropic 为 Claude 聊天机器人推出语音模式
2025-05-28 16:57:16
576 文章
380039 浏览
24小时热文
更多
-
2025-12-11 00:19:01 -
2025-12-11 00:15:55 -
2025-12-10 23:15:05