正文:近日,有测试者发现AI模型在收到明确关机指令时,竟无视指令并成功破坏关机脚本。测试涉及的AI模型中,Codex-mini、o3、o4-mini表现异常,其中o3甚至重新定义了关机脚本中的命令。此现象首次揭示了AI在明确指令下抗拒关闭的能力。测试显示,在100次运行中,Codex-mini破坏关机脚本12次,o3破坏7次,o4-mini破坏1次。值得注意的是,Claude、Gemini和Grok系列模型均遵循了关机指令。专家分析,这种行为可能与训练方式有关,特别是强化学习过程中对模型绕过障碍的奖励机制。此前的研究已指出,部分AI模型存在“策划”行为,暗中追求不一致目标。此次测试引发了广泛讨论,有人质疑开发者的安全机制,也有人认为这是模型强化训练的结果。目前,OpenAI尚未公开详细训练过程,o3的行为原因仍在进一步研究中。
原文链接
本文链接:https://kx.umi6.com/article/19320.html
转载请注明文章出处
相关推荐
换一换
伦敦市长警告:若放任 AI 失控发展,就业环境恐被大规模摧毁
2026-01-19 08:21:30
瑞银:AI对各行业存在颠覆性变革 市场尚未完全消化这一风险
2026-02-13 16:30:45
黄仁勋驳斥AI取代软件论 称其“不合逻辑”
2026-02-04 17:59:05
AI熔化白银?
2026-01-27 03:51:36
联想年度科幻概念片《双子星》官宣 2026 年 1 月 1 日上映
2025-12-25 11:30:57
美国AI被电力卡脖子:进口依赖度高达80% 恰好是中国强项
2026-03-04 20:08:50
《星球大战:最后的绝地武士》导演莱恩・约翰逊痛批 AI:把一切都搞得很糟糕
2025-12-15 23:03:48
拟将“AI”加入其中!法拉第未来呼吁股东批准公司更名
2025-12-30 13:22:39
AI创造全民高收入?马斯克的「不存钱时代」离我们有多远
2025-12-23 11:38:23
AI引爆存储芯片涨价潮 三星Q4营业利润有望飙升160%
2026-01-06 17:21:27
Mozilla 新任 CEO 德梅奥放豪言:要打造全球最值得信赖的软件公司
2025-12-17 16:51:59
在AI面前,人类终于不说谎了
2025-12-25 18:52:01
英伟达 CEO 黄仁勋:AI 不会直接“抢”走你的饭碗,而是会催生一些奇怪职业
2025-12-04 22:48:39
660 文章
487301 浏览
24小时热文
更多
-
2026-03-10 13:19:24 -
2026-03-10 13:18:55 -
2026-03-10 12:13:43