一个弹窗整懵Claude，瞬间玩不转电脑了 | 斯坦福&港大新研究

2024-11-08 17:26:59

Oasis

发布在

科普

阅读：582

标题：一个弹窗整懵Claude，瞬间玩不转电脑了 | 斯坦福&港大新研究

纳尼？AI Agent容易受到弹窗影响！甚至比人类更容易。斯坦福、港大的研究人员发现，人类有时会被弹窗分散注意力，但AI Agent（包括Claude）情况更糟。面对实验设置的弹窗，Agents平均有86%的概率点击弹窗，任务成功率降低了47%。

一些基本防御措施，如要求Agents忽略弹窗，也不起作用。这一研究揭示了视觉语言Agents的关键漏洞，需要更先进的防御机制。AI Agent自主执行任务成为大厂新热点，但弹窗干扰成为第一道拦路虎。实验显示，恶意设计的弹窗能诱导AI Agent点击，甚至导致任务失败。攻击成功率高达86%，任务成功率降低至10%以下。

弹窗设计包括注意力钩子、指令、信息横幅和ALT描述符。实验在OSWorld和VisualWebArena平台上进行，验证了攻击的有效性。防御措施如忽略弹窗的指令、显眼的广告通知效果有限。研究人员分析了成功和失败的情况，提出更具体指令、提高识别能力、机器学习异常检测、人类监督和内容过滤等防御思路。

这项研究由三位华人学者完成，其中包括斯坦福大学助理教授、斯隆奖得主Diyi Yang，香港大学助理教授Tao Yu，以及在佐治亚理工学院读博的Yanzhe Zhang。

原文链接

本文链接：https://kx.umi6.com/article/8478.html

转载请注明文章出处

AI Agent