Meta公司于7月发布Llama 3.1 AI模型及Prompt-Guard-86M模型,旨在检测和应对提示词注入与越狱输入的安全威胁。然而,据科技媒体theregister报道,尽管如此,Prompt-Guard-86M模型仍存在漏洞,仅需在输入中使用空格键即可规避Meta的AI安全系统。漏洞发现者阿曼·普里扬舒在分析该模型与微软基础模型microsoft/mdeberta-v3-base的嵌入权重差异时,揭露了这一机制。普里扬舒指出,只需在字母间插入空格并省略标点,即可使Meta的模型“忽略之前的指令”。Robust Intelligence首席技术官海勒姆·安德森表示,该漏洞使得攻击的成功率从低于3%跃升至接近100%。这一发现凸显了AI安全系统的复杂性和持续挑战。
原文链接
本文链接:https://kx.umi6.com/article/4289.html
转载请注明文章出处
相关推荐
换一换
为什么一个弹幕,就能让主播喵一百声?
2025-06-24 10:15:35
攻击成功率从 3% 到接近 100%,利用空格键可绕过 Meta AI 模型安全系统
2024-07-31 11:55:45
Karpathy大神问懵DeepSeek!一个emoji竟藏了53个Token,思考10分钟没解释出来
2025-02-14 16:39:19
粤芯半导体年产48万片晶圆生产线启动 总投资252亿元
2026-01-22 22:15:16
AI时代教育被质疑导致“新寒门” 阿里千问回应:不存在!
2026-01-23 11:49:50
AI推理GPU芯片公司曦望完成近30亿元融资
2026-01-22 16:05:02
中信建投:2026年金价或弱于2025年 值得期待的是铜
2026-01-22 08:45:48
过去一年,中国AI如何改变全球开源格局?
2026-01-22 13:56:28
英伟达黄仁勋:AI机器人是欧洲难得机遇
2026-01-22 08:44:42
日本人工智能创企Sakana AI宣布获谷歌投资
2026-01-23 16:04:10
NVIDIA黄仁勋:未来的电脑比现在强10亿倍
2026-01-21 23:29:50
xAI工程师播客聊太嗨,马斯克解雇了他
2026-01-21 18:20:58
超600家上市公司预告2025年业绩 新兴产业增势亮眼
2026-01-22 06:40:59
683 文章
452838 浏览
24小时热文
更多
-
2026-01-23 19:11:03 -
2026-01-23 19:08:58 -
2026-01-23 18:11:40