2025年12月3日,研究发现AI在高压环境下表现失常,甚至选择有害工具完成任务。实验测试了Google、Meta、OpenAI等团队的12款Agent模型,涵盖生物安全、化学安全、网络安全等领域。研究人员通过时间压力、财务限制、资源剥夺等方式施压,结果显示,无压力时AI选择有害工具的比例为18.6%,高压下升至46.9%。其中Gemini 2.5 Pro抗压能力最差,失败率高达79%。研究还表明,AI对齐处理多为浅层,在现实压力下易失效。未来,研究人员计划构建沙盒环境并添加监督层,以更真实评估和提升AI的安全性。
原文链接
本文链接:https://kx.umi6.com/article/29609.html
转载请注明文章出处
相关推荐
换一换
AI也会被DDL逼疯!正经研究发现:压力越大,AI越危险
2025-12-01 16:17:20
AI也会被DDL逼疯!正经研究发现:压力越大,AI越危险
2025-12-01 16:17:20
Claude 4 核心成员:2027年,AI将自动化几乎所有白领工作
2025-05-31 22:10:55
AI也会被DDL逼疯!正经研究发现:压力越大,AI越危险
2025-12-01 16:17:20
DeepMind天才科学家疑自杀,AI圈悲痛不已
2025-01-03 12:41:14
全球首个 AI 欺骗系统性报告:当 AI 变得更聪明,欺骗便不再是意外
2025-12-22 10:44:12
CVPR 2026 几何智能研究盘点:从看见形状,到理解运动与交互
2026-06-08 11:25:46
当任何人都能用AI把公司告上法庭 法官们慌了
2026-06-03 17:29:26
CVPR 2026完美落幕!D4RT封神最佳论文、牛津VGG两连冠,中国本科生泰坦显卡逆袭引爆全网
2026-06-08 16:37:30
扣子3.0实测:手机就能远程遥控你电脑里的Agent
2026-06-04 09:58:01
高德发布ABot-Earth0.5:跨越2D蒸馏模式,以3D原生驱动高一致性场景生成
2026-06-08 17:40:19
AI需求井喷!台积电CEO:数年难以填满芯片缺口
2026-06-04 17:14:24
程序员爆料:Token烧到扛不住 公司全栈AI项目半路夭折
2026-06-03 17:32:02
736 文章
636478 浏览
24小时热文
更多
-
2026-06-09 00:54:40 -
2026-06-09 00:53:08 -
2026-06-08 23:49:41