
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
OpenAI新研究发现,增加推理时间可增强模型对抗攻击的能力。这为现有防御方法提供了新思路,尤其是“对抗性训练”需依赖先验知识并权衡稳健性和模型能力。
实验表明,不进行对抗性训练,只需增加推理时的计算量,模型的对抗稳健性就能显著提升。此研究由OpenAI联创之一Wojciech Zaremba及Bo...
原文链接
OpenAI今日发布新技术,无需专门对抗训练即可大幅提升模型的鲁棒性。该技术通过增加推理时间和算力资源实现,成功应用于o1-preview和o1-mini模型,有效抵御了Many-shot、Soft Token Attack、Human Red-teaming Attack等多种攻击方法。此次突破无需预知攻击形式,显著增强了模型的安全性能。【23日】
原文链接
加载更多

暂无内容