1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

瑞士洛桑联邦理工学院的研究揭示了一种新漏洞,通过将提示词设为"过去式",能轻易突破GPT-4o等六款大模型的安全防线,攻击成功率显著提高。中文语境同样适用,最显著的是GPT-4o,其越狱成功率从1%飙升至88%。研究者实测发现,模型对过去时态请求特别敏感,且随着攻击次数增加,成功率提升。尽管现有安全措施脆弱,但使用拒绝数据微调可以防御这类攻击。这一发现挑战了当前语言模型对齐技术,暗示需更全面的方法评估模型安全。论文已发表于arXiv:2407.11969。

原文链接
本文链接:https://kx.umi6.com/article/3651.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
OpenAI 拓展医疗保健领域,GPT-4o 模型打造 AI 工具:辅助筛查 / 治疗癌症
2024-06-19 09:34:42
GPT-4o更容易越狱?北航&南洋理工上万次测试给出详细分析
2024-06-12 15:09:32
奥尔特曼:GPT-4o文生图功能总生成量将突破10亿 大多数改变世界的公司最初都被视为“套壳”
2025-04-07 17:11:17
一手测评Claude 3.5,它真比GPT-4o强吗?
2024-06-21 22:15:17
LG 预告首款家用管家机器人明年登场:集成 GPT-4o AI 模型,注重和用户情感互动
2024-12-03 16:27:11
把 AI 放进《我的世界》服务器:GPT-4o 杀牛宰羊,Claude3.5 把家拆了
2024-10-21 13:29:28
GPT-4o 现货变期货,是什么在拖OpenAI 的后腿
2024-07-16 19:38:45
GPT-4o失控,突然呻吟尖叫发癫,引发研究人员恐慌
2024-08-09 18:50:30
GPT-4o 差点没及格!首个多任务长视频评测基准,它有亿点难
2024-06-22 17:28:20
豆包大模型披露2024技术进展,亮相7个月综合能力全面对齐GPT-4o
2024-12-30 15:18:52
吉卜力风格 AI 图刷屏之际,消息称 OpenAI 正测试 GPT-4o 生图模型水印
2025-04-07 08:45:55
大模型无法真正理解视频,GPT-4o正确率仅36%,南洋理工大团队提出新基准
2025-08-01 19:06:23
菲尔兹奖得主亲测 GPT-4o,经典过河难题破解失败
2024-06-30 15:55:25
24小时热文
更多
扫一扫体验小程序