1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

10月11日,Anthropic、英国AI安全研究院与艾伦·图灵研究所联合研究发现,仅需约250份恶意文档即可攻破任意规模的AI模型。研究人员通过构建6亿至130亿参数的模型并测试发现,恶意数据植入不受模型规模影响,且无法通过增加干净数据稀释风险。攻击者可借此植入后门,触发有害指令。研究颠覆了以往‘大模型更安全’的假设,并呼吁AI领域聚焦防御机制建设,而非盲目追求模型扩大。论文已发布在arXiv平台,强调数据投毒威胁的紧迫性。

原文链接
本文链接:https://kx.umi6.com/article/26488.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
艾伦・图灵研究所等最新研究:只需 250 份恶意文档就能攻破任意体量 AI 模型
2025-10-11 17:32:43
0.01%虚假训练文本可致有害内容增加11.2% 警惕人工智能“数据投毒”
2025-08-05 07:08:37
研究:训练数据含 0.001% 的错误信息足以“毒害”医学 AI 模型
2025-01-14 18:15:55
官方提醒警惕AI“数据投毒” 0.01%虚假训练文本可致有害内容增加11.2%
2025-08-05 08:14:46
又一批AI社交产品悄悄“死亡”了
2025-10-11 15:29:51
20个30岁以下、敢把世界“掀翻”的“疯子”正在集结
2025-10-11 10:12:04
姚顺宇离职背后:国产大模型已经上桌了
2025-10-11 10:15:41
工信部等七部门:加强新型信息基础设施建设 按需布局算力基础设施 加速算力与行业融合应用
2025-10-11 17:33:44
当AI开始设计芯片
2025-10-11 10:21:25
高校创业公司Campus聘请Meta前AI负责人担任首席技术官
2025-10-11 10:46:52
两部门:有条件的中央和国家机关部门、省(自治区、直辖市)可统一部署智能算力资源、人工智能大模型
2025-10-11 10:44:41
泰勒·斯威夫特再次陷入AI 风波,但这次粉丝“倒戈”了
2025-10-11 10:13:16
所有AI的馈赠,早已在暗中标好了价格
2025-10-11 20:32:50
24小时热文
更多
扫一扫体验小程序