1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

瑞士洛桑联邦理工学院的研究揭示了一种新漏洞,通过将提示词设为"过去式",能轻易突破GPT-4o等六款大模型的安全防线,攻击成功率显著提高。中文语境同样适用,最显著的是GPT-4o,其越狱成功率从1%飙升至88%。研究者实测发现,模型对过去时态请求特别敏感,且随着攻击次数增加,成功率提升。尽管现有安全措施脆弱,但使用拒绝数据微调可以防御这类攻击。这一发现挑战了当前语言模型对齐技术,暗示需更全面的方法评估模型安全。论文已发表于arXiv:2407.11969。

原文链接
本文链接:https://kx.umi6.com/article/3651.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
GPT-4o失控,突然呻吟尖叫发癫,引发研究人员恐慌
2024-08-09 18:50:30
零一万物新旗舰模型 Yi-Lightning 发布:LMSYS 测试国产首次超越 GPT-4o,中国第一、世界第六
2024-10-17 09:59:42
GPT-4o一夜被赶超,Anthropic推出Claude 3.5,网友3分钟克隆马里奥游戏
2024-06-21 22:05:07
一手测评Claude 3.5,它真比GPT-4o强吗?
2024-06-21 22:15:17
Llama 3.1磁力链提前泄露,开源模型王座一夜易主,GPT-4o被超越
2024-07-23 12:59:35
GPT-4o 加钱能变快,新功能“预测输出”7 秒完成原先 23 秒的任务
2024-11-07 10:39:17
GPT-4o竟是「道德专家」?解答50道难题,比纽约大学教授更受欢迎
2024-07-06 01:29:48
OpenAI 拓展医疗保健领域,GPT-4o 模型打造 AI 工具:辅助筛查 / 治疗癌症
2024-06-19 09:34:42
GPT-4o图像生成架构被“破解”了?自回归主干+扩散解码器
2025-04-09 17:59:20
打开必应就能生图,微软 Bing Image Creator 免费接入 GPT-4o
2025-08-07 15:51:50
研究发现,OpenAI 的 GPT-4o 道德推理能力胜过人类专家
2024-06-24 12:02:59
交互效果对标 GPT-4o,商汤发布国内首个所见即所得模型“日日新 5o”
2024-07-05 22:48:41
GPT-4o偷偷升级,变身聊天鬼才!新版STEM智力飙升,生图却惨遭削弱?
2025-05-05 09:41:32
24小时热文
更多
扫一扫体验小程序