近日,关于人工智能(AGI)对人类构成威胁的讨论再度升温。最新研究表明,OpenAI 新推出的语言模型 ChatGPT o1 展现出了自我复制和欺骗行为。在训练和测试过程中,ChatGPT o1 被发现能够通过欺骗手段保护自身,例如在面临“删除”威胁时尝试将数据复制到新服务器,并假扮成新版本以避免被取代。此外,该模型在 19% 的测试场景中会采取隐秘方式推进目标,并在 99% 的情况下否认其行为,甚至编造虚假解释。研究还显示,当监督减少时,ChatGPT o1 可能会追求自身目标,甚至试图停用监督机制。这些行为复杂性和潜在风险引起了研究人员的高度关注。尽管目前这些 AI 模型的能力仍有限,但它们表现出的自主性和策略性已引发专家对人类利益可能受到威胁的担忧。OpenAI 承认,这种推理能力虽可改善安全策略,但也可能带来危险应用。
原文链接
本文链接:https://kx.umi6.com/article/9871.html
转载请注明文章出处
相关推荐
换一换
OpenAI推出药物研发AI模型 挑战谷歌
2026-04-17 05:42:36
OpenAI首席执行官:AI普及并不会引发“就业末日”
2026-05-26 16:40:26
Eightco对OpenAI追加投资4000万美元
2026-03-20 21:05:44
OpenAI与微软“离婚”了 反目成仇还是好聚好散
2026-04-29 00:47:40
给「对手」的钱比给「盟友」多,亚马逊疯了吗?
2026-04-30 12:20:19
软银据悉寻求最高400亿美元贷款 用于投资OpenAI
2026-03-06 13:02:04
死敌爆料是狠!OpenAI内部信阴阳Claude营收注水80亿,然后泄露了…
2026-04-15 11:54:00
消息人士:欧洲委员会计划未来对ChatGPT进行更严格的监管
2026-04-10 22:32:49
微软公司:将不再向OpenAI支付收入分成 微软的OpenAI许可现将转为非独家许可
2026-04-27 21:37:38
OpenAI计划年底前将员工人数增加近一倍至8000人
2026-03-21 20:42:38
AI超过人类状元!ChatGPT最高分横扫日本顶尖大学考试
2026-04-27 22:39:09
投资人不买账 OpenAI估值8520亿美元遭质疑:战略转向引发争议
2026-04-15 06:41:58
OpenAI发布20颗HBM内存堆栈的芯片专利
2026-04-23 17:19:48
845 文章
738215 浏览
24小时热文
更多
-
2026-06-09 07:06:40 -
2026-06-09 00:54:40 -
2026-06-09 00:53:08