1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

2025年11月,意大利罗马大学与DEXAI实验室研究发现,将恶意指令写成诗歌可轻松突破大语言模型的安全限制。研究人员测试了25个主流模型,包括谷歌Gemini、OpenAI GPT-5等,结果显示‘诗歌攻击’使防御成功率大幅下降,部分模型如Gemini 2.5 Pro的防御率直接归零。研究指出,大模型因过度解读隐喻而易受攻击,小模型却因‘读不懂’幸免于难。论文强调,现有安全机制过于依赖关键词匹配,忽视了风格伪装的风险,呼吁重新审视AI安全评估方法。相关研究已发布在arXiv平台。

原文链接
本文链接:https://kx.umi6.com/article/29101.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
荣耀 MagicOS 9.0 升级支持 30 亿参数端侧大语言模型:功耗下降 80%,内存占用减少 1.6GB
2024-10-23 16:40:26
OpenAI 被曝正开发全新 AI 大语言模型:代号“大蒜”,性能超越谷歌 Gemini 3
2025-12-03 00:43:57
大语言模型会推理吗?
2024-11-13 11:33:40
当 AI 下场炒 A 股,「推理」成了新的直觉
2025-10-28 12:51:59
deepseek关联公司公布大语言模型部署方法专利
2025-08-01 14:04:10
从蛰伏到王炸,RL启示录
2025-03-25 19:11:14
AI竞技场,归根到底只是一门生意
2025-08-06 15:37:54
过去一年,哪些AI模式跑出来了?
2024-08-07 19:19:32
自诩无所不知的大模型,能否拯救笨手笨脚的机器人?
2025-05-06 09:49:31
鸿海首个大语言模型 FoxBrain 发布:具备推理能力,未来计划部分开源
2025-03-10 16:45:45
之江实验室薛贵荣:当AI开始做科研,我看到了大语言模型的天花板丨GAIR 2025
2025-12-31 17:32:07
罗永浩重返科技行业:AI智能助理J1 Assistant上线
2025-01-05 19:57:49
顺丰发布“丰语”大语言模型:摘要准确率超 95%,号称物流垂域能力超越通用模型
2024-09-10 19:32:12
24小时热文
更多
扫一扫体验小程序