1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:Claude自动玩崩铁清日常,NUS新论文完整测评AI电脑操控

正文: 新加坡国立大学团队测试了Claude在20多个场景下的表现,其中最吸引人的是AI能自动玩手游并完成日常任务。研究中选用米哈游的《崩坏:星穹铁道》,只需对Claude说“帮我完成今天的模拟宇宙”,它就能自动打开游戏菜单、找到“黄金花萼”、设置挑战次数,并启动自动战斗。

这项技术不仅限于游戏,Claude还能智能理解规则和目标,在不同任务间灵活调整。它还展示了在网页搜索、办公软件操作等方面的强大能力,如在Amazon和Apple官网下单购物、在Apple Music添加歌曲、编辑Excel数据等。

Claude Computer Use的潜力远未被完全挖掘。该系统基于API设计了一个自动化GUI框架,分为系统提示、状态观察、推理范式、工具使用、GUI动作空间和历史视觉上下文维护六个部分。团队设计了详尽的测试实验,涵盖了网页搜索、工作流程、办公生产力和视频游戏等多个领域。

尽管Claude在某些复杂操作中偶尔失败,比如未能正确导航到特定网页选项卡或准确选择文本字段,但整体表现令人印象深刻。团队已公开所有测试用例的具体信息,未来值得期待。

参考资料: https://arxiv.org/pdf/2411.10323 https://github.com/showlab/computer_use_ootb

原文链接
本文链接:https://kx.umi6.com/article/9520.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
你的iPhone 即将“换脑”,ChatGPT 和Claude 有望接管苹果AI,Siri 要变聪明了?
2025-07-01 12:54:05
Claude 接管人类电脑编程:程序员沸腾、OpenAI 反击,智能体大战一触即发
2024-10-25 23:02:57
Anthropic 推出新功能:用户可直接在 Claude 聊天机器人中构建 AI 驱动应用
2025-06-26 07:37:47
24小时热文
更多
扫一扫体验小程序