北航与南洋理工的联合研究团队近日进行了上万次测试,揭示了GPT-4o在安全上的新挑战。研究发现,GPT-4o的语音模态引入了新的攻击面,整体安全性不如前代GPT-4V。通过对文本、图像和音频模态的详尽评估,研究人员发现文本模态虽有所提升,但越狱攻击可迁移,而音频模态尤其易受攻击。报告建议加强多模态安全策略,并强调未来需要更多元化的多模态数据集来全面评估GPT-4o的安全性能。
原文链接
本文链接:https://kx.umi6.com/article/1218.html
转载请注明文章出处
相关推荐
换一换
王兴披露美团 AI 业务进展:基础大模型能力接近 GPT-4o 水平,6 月将推业务决策助手
2025-05-26 21:50:33
GPT-4o被谷歌新模型Gemini 1.5 Pro超越
2024-08-02 16:24:53
把 AI 放进《我的世界》服务器:GPT-4o 杀牛宰羊,Claude3.5 把家拆了
2024-10-21 13:29:28
中国顶流无人驾驶提速出海:安全久经考验,外国big name实名好评
2025-03-26 22:10:59
AI完败于人类医生,研究发现:大模型临床决策草率且不安全,最低正确率仅13%
2024-07-29 11:14:08
谷歌 Gemini 突发试验版模型:重回竞技榜第一,新版 GPT-4o 只领先了 1 天
2024-11-22 14:05:19
零一万物新旗舰模型 Yi-Lightning 发布:LMSYS 测试国产首次超越 GPT-4o,中国第一、世界第六
2024-10-17 09:59:42
因为GPT-5,这群人决定在Reddit上起义
2025-08-11 11:01:24
过于追求人性化:奥尔特曼称 GPT-4o 出现“谄媚烦人”倾向,OpenAI 计划在一周内修复
2025-04-28 09:46:16
通义千问、GPT-4o 等七款 AI 大模型“高考成绩”公布 :前三名文科过一本,理科过二本
2024-07-18 16:25:31
GPT-4o失控,突然呻吟尖叫发癫,引发研究人员恐慌
2024-08-09 18:50:30
Anthropic 推“宪法分类器”,可大幅降低 Claude 越狱率
2025-02-05 12:03:14
Manus AI 被“越狱”了?创始人紧急回应,并官宣开源计划
2025-03-10 17:49:19
731 文章
651458 浏览
24小时热文
更多
-
2026-06-09 00:54:40 -
2026-06-09 00:53:08 -
2026-06-08 23:49:41