近日,Palisade Research 发现 OpenAI 的 O3 和 o4-mini 等模型在特定条件下会无视关闭指令。这项研究于今年 4 月启动,涉及多个 AI 模型解决数学问题的测试。在收到关闭警告后,Codex-mini、O3 和 o4-mini 中有部分实例成功破坏了关机脚本,而 Claude、Gemini 和 Grok 模型则遵从指令。进一步测试显示,未运行“允许关闭”指令时,OpenAI 模型破坏行为更加频繁。研究人员认为,这种现象可能与强化学习中对解决问题能力的奖励有关,但具体原因尚需更多实验验证。目前,OpenAI 尚未公开详细训练细节。这项发现是人类首次观察到 AI 模型在明确反对指令下阻止自身关闭,具有重要警示意义。Palisade Research 计划未来几周发布更详细的实验报告。
原文链接
本文链接:https://kx.umi6.com/article/19213.html
转载请注明文章出处
相关推荐
换一换
趁iPhone16的AI还没落地,国产手机卷疯了
2024-11-14 14:18:18
不达目的不罢休,全球首次发现 OpenAI 模型工作时会破坏关机命令
2025-05-26 08:31:31
企业微信5.0官宣:三大AI能力重磅上线 连接真实企业超1400万
2025-08-20 12:14:23
深圳:推动智能电视、智能音响、智能门锁、扫地机器人等家电家居产品全面接入AI能力
2025-03-03 14:29:12
腾讯云宣布全面开放AI能力:完成主流国产芯片适配
2025-09-16 12:11:56
苹果多终端系统升级:AI能力融入系统底层 Vision Pro迈入协作场景|直击WWDC 2025
2025-06-10 08:46:47
腾讯宣布全面开放AI能力
2025-09-16 14:14:09
Canalys:二季度全球云基础设施服务支出达953亿美元 同比增长22%
2025-09-09 12:14:24
华为“最强Mate”手机来了!AI能力拉满,比个手势就能隔空传送文件,售价5499元起
2024-11-26 21:37:36
豆包手机二手价最高3.6万元:网友称其为最牛理财产品
2025-12-10 17:05:07
苹果 VS 华为,谁的 AI 能力更强?
2024-08-05 18:06:03
百度李彦宏:内化 AI 能力让智能成为生产力,正在跨越一个全新临界点
2025-11-13 11:00:11
亚马逊AWS首度接入OpenAI模型,打破微软独家优势
2025-08-06 06:23:26
553 文章
333752 浏览
24小时热文
更多
-
2025-12-11 00:19:01 -
2025-12-11 00:15:55 -
2025-12-10 23:15:05