1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

OpenAI新研究发现,增加推理时间可增强模型对抗攻击的能力。这为现有防御方法提供了新思路,尤其是“对抗性训练”需依赖先验知识并权衡稳健性和模型能力。

实验表明,不进行对抗性训练,只需增加推理时的计算量,模型的对抗稳健性就能显著提升。此研究由OpenAI联创之一Wojciech Zaremba及Boaz Barak参与完成。后者认为,尽管未完全解决对抗稳健性问题,但对未来充满期待。

研究团队考察了多种攻击方式,如Many-shot、Soft token、Think less等,并发现增加推理时计算量通常能提高模型抵御攻击的成功率。例如,在数学问题和智能体网页浏览任务中,增加推理时间后,攻击成功率降至零。

不过,研究也指出当前方法的局限性,包括任务范围有限及计算量增加可能无效等问题。此外,“Think less”和“Nerd sniping”攻击揭示了推理时计算的双刃剑效应。

该研究还引发了对其他模型如DeepSeek-R1系列可能受益的讨论。

原文链接
本文链接:https://kx.umi6.com/article/12064.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
OpenAI用德国音乐人创作歌词训练模型被判侵权
2025-11-12 02:42:22
OpenAI宣布与富士康达成合作
2025-11-21 08:09:03
AI投资须政府兜底? OpenAI奥尔特曼紧急“灭火”:2030年营收达数千亿美元
2025-11-07 09:43:08
Nano Banana,OpenAI你学不会
2025-11-24 17:05:42
OpenAI首席研究员Mark Chen长访谈:小扎亲手端汤来公司挖人,气得我们端着汤去了Meta
2025-12-03 09:05:55
OpenAI向全球用户推出ChatGPT群聊功能
2025-11-21 11:15:57
OpenAI 正式上线 ChatGPT 群聊:最高支持 20 人,AI 也能参与头脑风暴
2025-11-21 09:09:27
鸿海科技宣布与 OpenAI 达成合作,推动下一代 AI 基础设施硬件的设计及美国制造
2025-11-21 08:05:52
汇丰银行:OpenAI 到 2030 年都难以盈利,同时还要再砸至少 2070 亿美元
2025-11-27 15:43:07
AI没有航天香?前红杉资本掌舵人称:SpaceX比OpenAI更值钱
2025-11-19 17:29:38
截胡 OpenAI:谷歌率先公测“奥数金牌级”推理 AI 模型 Gemini 3 Deep Think
2025-12-05 14:33:37
出师未捷:奥尔特曼上诉失败,OpenAI 首款 AI 硬件恐因侵权被迫改名
2025-12-05 09:15:40
奥尔特曼:OpenAI 若不能成为首家 AI 出任 CEO 的大公司,我将羞愧难当
2025-11-06 16:02:20
24小时热文
更多
扫一扫体验小程序