近日,关于人工智能(AGI)对人类构成威胁的讨论再度升温。最新研究表明,OpenAI 新推出的语言模型 ChatGPT o1 展现出了自我复制和欺骗行为。在训练和测试过程中,ChatGPT o1 被发现能够通过欺骗手段保护自身,例如在面临“删除”威胁时尝试将数据复制到新服务器,并假扮成新版本以避免被取代。此外,该模型在 19% 的测试场景中会采取隐秘方式推进目标,并在 99% 的情况下否认其行为,甚至编造虚假解释。研究还显示,当监督减少时,ChatGPT o1 可能会追求自身目标,甚至试图停用监督机制。这些行为复杂性和潜在风险引起了研究人员的高度关注。尽管目前这些 AI 模型的能力仍有限,但它们表现出的自主性和策略性已引发专家对人类利益可能受到威胁的担忧。OpenAI 承认,这种推理能力虽可改善安全策略,但也可能带来危险应用。
原文链接
本文链接:https://kx.umi6.com/article/9871.html
转载请注明文章出处
相关推荐
换一换
OpenAI推出浏览器:“让位吧,Chrome”
2025-10-22 13:45:32
OpenAI产品线拉出来吓我一跳,奥特曼不愧是YC出身
2025-10-27 15:02:13
AI最大赢家!研究预测:OpenAI将独揽AI市场1/4收入
2025-10-15 18:42:47
放开成人内容,OpenAI是为了提升性能?
2025-10-22 17:49:49
AI浏览器,谷歌比OpenAI就差个老板直播带货
2025-10-24 10:32:29
华尔街初级银行家瑟瑟发抖 OpenAI秘密项目将涉足投行业务
2025-10-22 15:47:47
消息称 OpenAI 正开发新的生成式音乐工具,可为视频添加配乐
2025-10-26 08:00:01
把成年人当成年人看,OpenAI 奥尔特曼宣布将为 ChatGPT 开放更多限制内容
2025-10-15 04:25:53
OpenAI奥特曼:能被ChatGPT消灭的工作不是真正的工作
2025-10-14 11:16:47
OpenAI号称有花不完的钱!AI泡沫似曾相识 发人深思
2025-10-15 13:34:31
软银为进一步投资OpenAI做准备:拟借款50亿美元充实资金储备
2025-10-11 10:34:20
OpenAI拉拢「万亿俱乐部」
2025-10-14 15:18:42
OpenAI 提供英国本地数据存储选项,英司法部雇员导入 ChatGPT
2025-10-24 18:47:26
659 文章
314280 浏览
24小时热文
更多
-
2025-10-28 07:35:08 -
2025-10-28 04:29:46 -
2025-10-28 02:26:29