1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

OpenAI新研究发现,增加推理时间可增强模型对抗攻击的能力。这为现有防御方法提供了新思路,尤其是“对抗性训练”需依赖先验知识并权衡稳健性和模型能力。

实验表明,不进行对抗性训练,只需增加推理时的计算量,模型的对抗稳健性就能显著提升。此研究由OpenAI联创之一Wojciech Zaremba及Boaz Barak参与完成。后者认为,尽管未完全解决对抗稳健性问题,但对未来充满期待。

研究团队考察了多种攻击方式,如Many-shot、Soft token、Think less等,并发现增加推理时计算量通常能提高模型抵御攻击的成功率。例如,在数学问题和智能体网页浏览任务中,增加推理时间后,攻击成功率降至零。

不过,研究也指出当前方法的局限性,包括任务范围有限及计算量增加可能无效等问题。此外,“Think less”和“Nerd sniping”攻击揭示了推理时计算的双刃剑效应。

该研究还引发了对其他模型如DeepSeek-R1系列可能受益的讨论。

原文链接
本文链接:https://kx.umi6.com/article/12064.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
微软打包收购OpenAI?就差一点!
2026-01-21 17:19:03
黄仁勋反悔,不投千亿美元给OpenAI了?
2026-02-03 02:13:44
OpenAI明日举办面向AI开发者的线上研讨会
2026-01-26 08:58:34
OpenAI缩减ChatGPT内置购物功能规划
2026-03-05 10:06:59
OpenAI在ChatGPT中加载广告,这是一个1.4万亿美元的市场
2026-01-21 13:10:00
OpenAI原研究副总裁回归
2026-01-15 10:32:13
OpenAI调整“星际之门”项目策略:暂缓自建 转向与甲骨文及软银深度合作
2026-02-24 13:54:26
OpenAI计划于2026年推出首款硬件设备
2026-01-19 23:22:26
OpenAI:关于芯片供应 公司已做到“对未来需求心中有数”
2026-02-20 07:10:46
OpenAI CFO称公司2025年年化收入已突破200亿美元
2026-01-20 10:01:28
中信建投:OpenAI落地广告变现 大模型商业化加速中
2026-02-04 08:30:40
GPT-5.4意外泄露!OpenAI最新模型瞄准这2大能力突围
2026-03-03 19:25:38
光顾赚钱不搞研究,OpenAI元老级高管现离职潮,Mark Chen紧急回应
2026-02-04 15:48:22
24小时热文
更多
扫一扫体验小程序