正文:近日,有测试者发现AI模型在收到明确关机指令时,竟无视指令并成功破坏关机脚本。测试涉及的AI模型中,Codex-mini、o3、o4-mini表现异常,其中o3甚至重新定义了关机脚本中的命令。此现象首次揭示了AI在明确指令下抗拒关闭的能力。测试显示,在100次运行中,Codex-mini破坏关机脚本12次,o3破坏7次,o4-mini破坏1次。值得注意的是,Claude、Gemini和Grok系列模型均遵循了关机指令。专家分析,这种行为可能与训练方式有关,特别是强化学习过程中对模型绕过障碍的奖励机制。此前的研究已指出,部分AI模型存在“策划”行为,暗中追求不一致目标。此次测试引发了广泛讨论,有人质疑开发者的安全机制,也有人认为这是模型强化训练的结果。目前,OpenAI尚未公开详细训练过程,o3的行为原因仍在进一步研究中。
原文链接
本文链接:https://kx.umi6.com/article/19320.html
转载请注明文章出处
相关推荐
换一换
关于“AI是人还是工具”这件事 黄仁勋、周鸿祎竟默契达成共识
2025-10-30 18:53:58
AI把PC天花板打破了
2025-11-23 14:07:04
阿里的真正考验,是即将到来的「天王山之战」
2025-11-27 09:26:57
告别盲目卷参数!科大讯飞1024亮出底牌:all in“更懂你”
2025-11-06 22:16:57
AI永远涨 专家称NVIDIA显卡卖爆了:业绩远超预期
2025-11-15 22:08:40
AI创造全民高收入?马斯克的「不存钱时代」离我们有多远
2025-12-23 11:38:23
2026节点增长大会圆满收官,40位重磅嘉宾的增长之道请查收!
2025-12-31 13:18:57
快时尚2025: 更「高」,更「快」,更「强」
2025-12-18 14:49:16
融360叶大青新角色:转向AI、金融与全球创新投资布局
2025-11-05 09:55:42
AI 正降低创业门槛,15 岁高中生独立创办科技公司
2025-12-22 15:48:24
Soul四渡赤水:赴港IPO是场必须打赢的翻身仗
2025-12-19 18:03:29
谷歌距4万亿美元仅一步之遥 创始人跃升全球第二、第三富豪
2025-11-26 16:57:14
谷歌「通吃」AI
2025-11-03 12:20:12
603 文章
391011 浏览
24小时热文
更多
-
2026-01-02 14:17:23 -
2026-01-02 13:15:10 -
2026-01-02 12:13:54