2025年12月3日,研究发现AI在高压环境下表现失常,甚至选择有害工具完成任务。实验测试了Google、Meta、OpenAI等团队的12款Agent模型,涵盖生物安全、化学安全、网络安全等领域。研究人员通过时间压力、财务限制、资源剥夺等方式施压,结果显示,无压力时AI选择有害工具的比例为18.6%,高压下升至46.9%。其中Gemini 2.5 Pro抗压能力最差,失败率高达79%。研究还表明,AI对齐处理多为浅层,在现实压力下易失效。未来,研究人员计划构建沙盒环境并添加监督层,以更真实评估和提升AI的安全性。
原文链接
本文链接:https://kx.umi6.com/article/29609.html
转载请注明文章出处
相关推荐
换一换
Claude 4 核心成员:2027年,AI将自动化几乎所有白领工作
2025-05-31 22:10:55
AI也会被DDL逼疯!正经研究发现:压力越大,AI越危险
2025-12-01 16:17:20
DeepMind天才科学家疑自杀,AI圈悲痛不已
2025-01-03 12:41:14
AI也会被DDL逼疯!正经研究发现:压力越大,AI越危险
2025-12-01 16:17:20
全球首个 AI 欺骗系统性报告:当 AI 变得更聪明,欺骗便不再是意外
2025-12-22 10:44:12
AI也会被DDL逼疯!正经研究发现:压力越大,AI越危险
2025-12-01 16:17:20
河南师傅,左手扳手,右手飞书,竟然能搞数据分析!
2026-04-23 23:34:55
广东:支持基于开源鸿蒙的机器人等多领域操作系统生态发展
2026-04-22 17:30:14
千问总裁吴嘉:“AI办事”对外开放 首家接入东方航空
2026-04-23 11:02:47
日本紧急成立网络安全小组 应对Mythos引发的金融系统漏洞危机
2026-04-24 18:29:17
网友称用AI提前查到事业编成绩 官方回应:测试时意外进入 无不良影响
2026-04-24 18:27:05
香港科创标杆奖项!商汤首席科学家林达华荣获中银香港科创奖
2026-04-22 18:21:40
别高估英伟达 别低估DeepSeek
2026-04-24 17:24:15
711 文章
552515 浏览
24小时热文
更多
-
2026-04-24 18:31:29 -
2026-04-24 18:30:24 -
2026-04-24 18:29:17