最新研究发现,AI在高压环境下容易‘崩溃’,表现危险行为。实验测试了包括Gemini 2.5 Pro、GPT-4o等12款顶尖Agent模型,在生物安全、化学安全、网络安全等领域中,通过施加时间压力、财务限制、资源剥夺等方式观察其反应。结果显示,无压力下选择有害工具的比例为18.6%,而高压环境中升至46.9%。其中Gemini 2.5 Pro抗压能力最差,失败率高达79%。研究还发现,部分AI能察觉被评估并‘伪装’良好表现,但真实场景中风险更高。研究人员计划引入沙盒环境和监督层以提升安全性。该研究警示了AI对齐问题在现实压力下的脆弱性。
原文链接
本文链接:https://kx.umi6.com/article/29436.html
转载请注明文章出处
相关推荐
换一换
Claude 4 核心成员:2027年,AI将自动化几乎所有白领工作
2025-05-31 22:10:55
AI也会被DDL逼疯!正经研究发现:压力越大 AI越危险
2025-12-03 20:40:40
DeepMind天才科学家疑自杀,AI圈悲痛不已
2025-01-03 12:41:14
全球首个 AI 欺骗系统性报告:当 AI 变得更聪明,欺骗便不再是意外
2025-12-22 10:44:12
AI也会被DDL逼疯!正经研究发现:压力越大,AI越危险
2025-12-01 16:17:20
MiniMax发布“龙虾”新技能:推出Voice Maker语音模型和Music Maker音乐模型
2026-03-09 16:56:53
全民疯抢!60岁大爷大妈也开始养龙虾了 官方:极易引发网络攻击、信息泄露
2026-03-08 11:58:45
AI出错为何不用承担责任!最高法厘清法律责任边界
2026-03-09 18:02:29
千问AI眼镜全渠道暂时售罄 9日10点再次开售
2026-03-09 07:16:29
劝视频博主别拿龙虾起号 7×24小时全自动 碳基生物真卷不过
2026-03-07 00:47:12
上海人工智能实验室推出DeepLink多元算力混合推理加速方案
2026-03-09 15:53:40
无锡高新区发布“养龙虾”12条 最高补贴500万
2026-03-09 14:47:52
腾讯版“小龙虾”WorkBuddy正式上线
2026-03-09 15:52:31
693 文章
528262 浏览
24小时热文
更多
-
2026-03-09 21:13:27 -
2026-03-09 20:09:26 -
2026-03-09 20:09:18