Meta公司于7月发布Llama 3.1 AI模型及Prompt-Guard-86M模型,旨在检测和应对提示词注入与越狱输入的安全威胁。然而,据科技媒体theregister报道,尽管如此,Prompt-Guard-86M模型仍存在漏洞,仅需在输入中使用空格键即可规避Meta的AI安全系统。漏洞发现者阿曼·普里扬舒在分析该模型与微软基础模型microsoft/mdeberta-v3-base的嵌入权重差异时,揭露了这一机制。普里扬舒指出,只需在字母间插入空格并省略标点,即可使Meta的模型“忽略之前的指令”。Robust Intelligence首席技术官海勒姆·安德森表示,该漏洞使得攻击的成功率从低于3%跃升至接近100%。这一发现凸显了AI安全系统的复杂性和持续挑战。
原文链接
本文链接:https://kx.umi6.com/article/4289.html
转载请注明文章出处
相关推荐
换一换
攻击成功率从 3% 到接近 100%,利用空格键可绕过 Meta AI 模型安全系统
2024-07-31 11:55:45
为什么一个弹幕,就能让主播喵一百声?
2025-06-24 10:15:35
AI浏览器何时才能安全?
2026-03-07 00:49:29
Karpathy大神问懵DeepSeek!一个emoji竟藏了53个Token,思考10分钟没解释出来
2025-02-14 16:39:19
Anthropic研究员:AI对就业市场的冲击尚处早期
2026-03-08 18:29:49
Transformer作者重造龙虾,Rust搓出钢铁版,告别OpenClaw裸奔
2026-03-06 18:21:20
甲骨文史上最大裁员:AI未取代人力 资金转向芯片、数据中心投资
2026-03-09 18:00:21
无垠拓界 基筑未来|无问智科重磅发布业界首个物理AI数据基座平台
2026-03-06 15:07:52
暴雪皮克斯老兵的AI社交实验:用声音匹配,MAU破260万,估值1.5亿美金
2026-03-09 13:39:33
抖音电商打击AI虚假营销:处置仿冒李亚鹏、王丽云等名人侵权内容超16万条
2026-03-09 19:06:14
无锡高新区发布“养龙虾”12条 最高补贴500万
2026-03-09 14:47:52
全国人大代表张帆:建议研究出台加强工业数据集建设的财税支持政策
2026-03-06 19:29:19
“最美PM”宋紫薇获红杉蚂蚁投资,创业方向略有调整,转向AI护肤
2026-03-09 14:44:41
710 文章
505050 浏览
24小时热文
更多
-
2026-03-09 21:13:27 -
2026-03-09 20:09:26 -
2026-03-09 20:09:18