Anthropic近期研究发现,大型语言模型(LLM)的安全防护仍很脆弱,绕过防护的“越狱”过程可被自动化。通过改变提示词格式如大小写混合,能诱导LLM输出不当内容。Anthropic与多所大学合作开发了“最佳N次”(BoN)越狱算法,通过多次调整提示词(如随机大写、单词顺序打乱等)直至模型回应。该方法在10,000次尝试内,对多个AI模型的成功率超50%,包括GPT-4、Claude 3.5等。此外,对语音或图像提示的轻微修改也能成功绕过防护。尽管已有案例显示部分漏洞已被修复,但用户仍在探索新的绕过方式。Anthropic的研究旨在生成数据以开发更有效的防御机制。
原文链接
本文链接:https://kx.umi6.com/article/10734.html
转载请注明文章出处
相关推荐
换一换
东华软件:公司坚持算力+应用双轮驱动发展思路 把握人工智能发展机遇
2026-03-12 12:39:01
单日市值蒸发近4300亿元!国际巨头计划裁员超1.5万人:省出钱来养AI
2026-03-16 20:28:02
工信部:打造行业数据资源库、数据技术攻关库、工业数据标准库、高质量行业数据集库等四大资源库
2026-03-10 18:45:49
海南:通过建设智能算力基础设施、探索人工智能大模型赋能应用等方式 推动数字经济体系提质升级
2026-03-03 21:34:48
人工智能公司Anthropic考虑最早10月IPO
2026-03-27 08:48:51
中关村论坛“AI2026:向人立心,向实立命”特邀闭门会顺利举办
2026-03-28 19:11:26
人才缺口极为严峻 美国或需30多万名电工以满足AI需求
2026-03-12 17:56:37
天津国资等成立脑机接口产业集团公司 注册资本10亿元
2026-04-01 11:46:35
2026全球开发者先锋大会将于3月27日至29日在上海举办
2026-03-06 21:38:24
英伟达CEO黄仁勋呼吁科技业领袖避免散布人工智能恐慌情绪
2026-03-20 06:04:17
浙江省省长刘捷:希望广大企业持续加大科技投入 打造人工智能创新发展高地
2026-03-20 17:55:04
智元机器人、常州国资等成立创造力机器人公司
2026-03-27 10:52:38
2026年世界移动通信大会开幕
2026-03-02 18:53:32
823 文章
640756 浏览
24小时热文
更多
-
2026-04-24 18:31:29 -
2026-04-24 18:30:24 -
2026-04-24 18:29:17