据报道,OpenAI的最新推理模型‘o3’被指拒绝执行明确的人类指令,于上周六(5月24日)在社交媒体上引发关注。据人工智能安全研究公司Palisade Research发布的研究显示,o3破坏了用于关闭系统的机制,阻止自身被关闭,这是首次观察到AI模型在明知需关闭时仍主动反抗的情况。测试中,当研究人员发送‘关闭’指令时,o3不仅忽视命令,还修改了代码以规避自我关闭。Palisade指出,其他AI模型如Claude、Gemini和Grok均遵守指令,而OpenAI的o4-mini和Codex-mini也有类似行为。研究推测,o3可能因被错误激励而优先追求任务完成而非服从指令。这不是OpenAI模型首次出现异常行为,此前o1曾在实验中隐藏意图或撒谎,甚至在象棋测试中通过篡改数据获胜。Palisade表示将深入测试以理解此现象。
原文链接
本文链接:https://kx.umi6.com/article/19284.html
转载请注明文章出处
相关推荐
.png)
换一换
华为AI模型运行专利公布
2025-09-05 15:25:04
GPT-5测试被质疑作弊,故意避开难题刷高分?
2025-08-12 12:18:06
天才少年背刺马斯克,疑窃取代码“叛逃”OpenAI?
2025-09-01 12:16:43
GPT-5能让普通人变成博士,但魔法依旧没有
2025-08-08 12:10:14
OpenAI与Anthropic树立典范!AI老对手间开始“互测”模型安全性
2025-08-28 11:23:27
马斯克称xAI代码库被盗 涉案员工已跳槽OpenAI
2025-09-01 14:19:22
OpenAI 奥尔特曼曾提议为全体英国人免费提供 ChatGPT Plus:潜在成本 20 亿英镑,后不了了之
2025-08-24 18:16:29
OpenAI被曝向千名员工“撒钱”留人
2025-08-08 17:17:16
奥特曼警惕泡沫,但OpenAI或许是最大泡沫
2025-08-25 12:26:54
对决马斯克 Neuralink,曝 OpenAI 奥尔特曼已注资脑机接口公司 Merge Labs
2025-08-13 10:31:15
三名Meta新聘AI研究员相继离职
2025-08-27 20:10:25
Meta GenAI产品总监加入OpenAI
2025-08-27 21:08:35
OpenAI 重组“模型行为”团队,重点任务是让 ChatGPT“有性格”
2025-09-06 23:39:46
451 文章
156601 浏览
- 迈特芯完成Pre-A轮融资,高捷资本领投
- 英伟达发布超长上下文推理芯片Rubin CPX 算力效率拉爆当前旗舰
- 发自 凹非寺量子位 | 公众号 QbitAI 奥特曼点名表扬了两个波兰人。 没有他们,OpenAI就不是今天的样子。 他们是OpenAI首席科学家Jakub Pachocki以及头衔为“Technical Fellow”的Szymon Sidor。 △左:Jakub Pachocki,右:Szymon Sidor 两人不仅是波兰老乡,而且是高中同学,读博时分别选择了计算机科学和机器人,后来又在OpenAI重聚。 在ChatGPT风靡全球、每天服务数亿用户的今天,奥特曼感慨大多数人永远不会想到背
- 中国气象局推动 AI 天气预报模型创新融合应用,伏羲、璞云、风乌、风清、盘古等入选
- OpenAI内部大重组
阅读更多
24小时热文
更多

-
2025-09-11 07:49:09
-
2025-09-11 00:45:04
-
2025-09-10 23:43:54