1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:一个弹窗整懵Claude,瞬间玩不转电脑了 | 斯坦福&港大新研究

纳尼?AI Agent容易受到弹窗影响!甚至比人类更容易。斯坦福、港大的研究人员发现,人类有时会被弹窗分散注意力,但AI Agent(包括Claude)情况更糟。面对实验设置的弹窗,Agents平均有86%的概率点击弹窗,任务成功率降低了47%。

一些基本防御措施,如要求Agents忽略弹窗,也不起作用。这一研究揭示了视觉语言Agents的关键漏洞,需要更先进的防御机制。AI Agent自主执行任务成为大厂新热点,但弹窗干扰成为第一道拦路虎。实验显示,恶意设计的弹窗能诱导AI Agent点击,甚至导致任务失败。攻击成功率高达86%,任务成功率降低至10%以下。

弹窗设计包括注意力钩子、指令、信息横幅和ALT描述符。实验在OSWorld和VisualWebArena平台上进行,验证了攻击的有效性。防御措施如忽略弹窗的指令、显眼的广告通知效果有限。研究人员分析了成功和失败的情况,提出更具体指令、提高识别能力、机器学习异常检测、人类监督和内容过滤等防御思路。

这项研究由三位华人学者完成,其中包括斯坦福大学助理教授、斯隆奖得主Diyi Yang,香港大学助理教授Tao Yu,以及在佐治亚理工学院读博的Yanzhe Zhang。

原文链接
本文链接:https://kx.umi6.com/article/8478.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
银河证券:AI Agent的商业模式正从“提供工具”向“交付价值”转变 SAAS企业有望迎来价值重估的机会
2025-07-11 08:34:15
AI Agent ,风口上的「猪」?
2025-08-26 10:40:43
裁员80人背后的AI生死局:Manus何以至此?
2025-07-10 16:25:53
“会操作手机的 AI”,智谱开源 AI Agent 模型 AutoGLM
2025-12-09 10:29:51
豆包、千问与Kimi,站在AI Agent的岔路口
2026-01-21 08:59:27
DeepSeek-V3.1 正式发布,官方详解迈向 AI Agent 时代的第一步
2025-08-21 15:34:29
连锁门店AI Agent应用分野:究竟相信人,还是相信算法?
2025-09-23 16:20:47
火山引擎重磅大会将至!豆包迎来全线升级 Agent或成主角
2025-06-09 15:33:23
零一万物押注企业级Agent,李开复也做起“推销员”
2025-07-23 11:47:50
阿里国际AI agent——Marco日均调用量已达10亿次
2025-07-27 12:01:48
大厂AI Agent角逐 字节跳动携扣子空间进击
2025-04-22 20:31:22
谷歌正在研发用于软件开发的AI Agent
2025-05-13 14:54:24
大厂「AI」智能体,等待 DeepSeek 时刻
2025-07-31 11:05:08
24小时热文
更多
扫一扫体验小程序