标题:一个弹窗整懵Claude,瞬间玩不转电脑了 | 斯坦福&港大新研究
纳尼?AI Agent容易受到弹窗影响!甚至比人类更容易。斯坦福、港大的研究人员发现,人类有时会被弹窗分散注意力,但AI Agent(包括Claude)情况更糟。面对实验设置的弹窗,Agents平均有86%的概率点击弹窗,任务成功率降低了47%。
一些基本防御措施,如要求Agents忽略弹窗,也不起作用。这一研究揭示了视觉语言Agents的关键漏洞,需要更先进的防御机制。AI Agent自主执行任务成为大厂新热点,但弹窗干扰成为第一道拦路虎。实验显示,恶意设计的弹窗能诱导AI Agent点击,甚至导致任务失败。攻击成功率高达86%,任务成功率降低至10%以下。
弹窗设计包括注意力钩子、指令、信息横幅和ALT描述符。实验在OSWorld和VisualWebArena平台上进行,验证了攻击的有效性。防御措施如忽略弹窗的指令、显眼的广告通知效果有限。研究人员分析了成功和失败的情况,提出更具体指令、提高识别能力、机器学习异常检测、人类监督和内容过滤等防御思路。
这项研究由三位华人学者完成,其中包括斯坦福大学助理教授、斯隆奖得主Diyi Yang,香港大学助理教授Tao Yu,以及在佐治亚理工学院读博的Yanzhe Zhang。
原文链接
本文链接:https://kx.umi6.com/article/8478.html
转载请注明文章出处
相关推荐
换一换
中数睿智获2亿元A+轮融资,鼎晖VGC与北京市AI基金领投
2025-07-16 12:02:00
2025上半年,AI Agent领域有什么变化和机会?
2025-07-11 08:33:06
阿里巴巴开源自主搜索 AI 智能体 WebAgent
2025-05-30 07:45:03
Salesforce 力压 AI Agent 赛道,称公司 30%-50% 日常工作已被人工智能接管
2025-06-27 15:09:40
AI Agent ,风口上的「猪」?
2025-08-26 10:40:43
离谱!现在的Agent都卷成100个成团了?3分钟并行干完5个复杂任务,还能随时改需求
2025-08-18 18:49:23
火山引擎重磅大会将至!豆包迎来全线升级 Agent或成主角
2025-06-09 15:33:23
连锁门店AI Agent应用分野:究竟相信人,还是相信算法?
2025-09-23 16:20:47
ChatGPT 再现安全漏洞:研究者利用猜谜游戏诱骗其生成 Win10 密钥
2025-07-14 19:26:08
龙虾上桌!上市公司抢着养 OpenClaw引爆科技圈
2026-03-09 18:01:30
编程即将被打穿?“使用”AI已过时,你准备好“委托”了吗?
2025-09-27 08:38:26
宇树回应“Go1 机器狗存安全漏洞”:黑客非法获取了管理密钥
2025-05-08 11:26:22
OpenClaw揭示AI智能体底层需求:人类的「拔线权」
2026-02-04 02:11:01
662 文章
526419 浏览
24小时热文
更多
-
2026-04-24 16:22:09 -
2026-04-24 16:21:03 -
2026-04-24 16:19:57