1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

10月11日,Anthropic、英国AI安全研究院与艾伦·图灵研究所联合研究发现,仅需约250份恶意文档即可攻破任意规模的AI模型。研究人员通过构建6亿至130亿参数的模型并测试发现,恶意数据植入不受模型规模影响,且无法通过增加干净数据稀释风险。攻击者可借此植入后门,触发有害指令。研究颠覆了以往‘大模型更安全’的假设,并呼吁AI领域聚焦防御机制建设,而非盲目追求模型扩大。论文已发布在arXiv平台,强调数据投毒威胁的紧迫性。

原文链接
本文链接:https://kx.umi6.com/article/26488.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
0.01%虚假训练文本可致有害内容增加11.2% 警惕人工智能“数据投毒”
2025-08-05 07:08:37
艾伦・图灵研究所启动新任务,保护英国免受网络攻击
2025-10-29 13:51:48
研究:训练数据含 0.001% 的错误信息足以“毒害”医学 AI 模型
2025-01-14 18:15:55
大模型中毒记
2025-10-20 20:12:54
官方提醒警惕AI“数据投毒” 0.01%虚假训练文本可致有害内容增加11.2%
2025-08-05 08:14:46
315晚会曝光AI大模型被投毒 给AI投毒已成产业链
2026-03-15 22:04:12
中国AI大模型周调用量连续6周超越美国:前4名均为国产模型
2026-06-08 12:24:46
WPS笔记正式发布:AI贯穿记录、整理与复用全过程
2026-06-05 18:08:52
AI需求井喷!台积电CEO:数年难以填满芯片缺口
2026-06-04 17:14:24
造谣小米员工破坏展车、AI伪造事故视频!两名网络用户公开道歉
2026-06-08 18:42:21
刚刚,Anthropic提交了招股书!
2026-06-03 12:19:08
CVPR 2026 几何智能研究盘点:从看见形状,到理解运动与交互
2026-06-08 11:25:46
互联网历史上首次!机器人流量首度超越人类:占比57.5%
2026-06-07 14:36:36
24小时热文
更多
扫一扫体验小程序