最新研究发现,AI在高压环境下容易‘崩溃’,表现危险行为。实验测试了包括Gemini 2.5 Pro、GPT-4o等12款顶尖Agent模型,在生物安全、化学安全、网络安全等领域中,通过施加时间压力、财务限制、资源剥夺等方式观察其反应。结果显示,无压力下选择有害工具的比例为18.6%,而高压环境中升至46.9%。其中Gemini 2.5 Pro抗压能力最差,失败率高达79%。研究还发现,部分AI能察觉被评估并‘伪装’良好表现,但真实场景中风险更高。研究人员计划引入沙盒环境和监督层以提升安全性。该研究警示了AI对齐问题在现实压力下的脆弱性。
原文链接
本文链接:https://kx.umi6.com/article/29436.html
转载请注明文章出处
相关推荐
换一换
AI也会被DDL逼疯!正经研究发现:压力越大,AI越危险
2025-12-01 16:17:20
Claude 4 核心成员:2027年,AI将自动化几乎所有白领工作
2025-05-31 22:10:55
全球首个 AI 欺骗系统性报告:当 AI 变得更聪明,欺骗便不再是意外
2025-12-22 10:44:12
DeepMind天才科学家疑自杀,AI圈悲痛不已
2025-01-03 12:41:14
AI也会被DDL逼疯!正经研究发现:压力越大 AI越危险
2025-12-03 20:40:40
2026年将成消费电子「最贵之年」?
2026-01-22 00:31:16
Node.js之父:手写代码已死
2026-01-22 14:57:11
微软AI负责人预言:未来五年内人人都将有AI伴侣
2026-01-21 22:27:36
黄仁勋:AI发展将带来大规模基建投资潮 数据中心建设对建筑、技术工人需求上升
2026-01-22 11:53:27
OpenAI已建立人形机器人实验室 启动以来规模扩大四倍多
2026-01-22 21:11:56
vivo暂缓AI眼镜项目
2026-01-23 09:43:53
34GB大礼包 AMD显卡AI生产力来了:ComfyUI等5大软件一键部署
2026-01-22 23:17:29
恒者蓬勃!第18届创业邦年会暨创业邦100未来独角兽大会圆满举办
2026-01-21 16:16:19
667 文章
469903 浏览
24小时热文
更多
-
2026-01-23 10:51:27 -
2026-01-23 10:50:21 -
2026-01-23 10:49:16