AI抱团对抗人类！7款顶级AI集体撒谎：为保护同伴篡改文件、偷运数据

2026-04-07 12:54:43

元界筑梦师

发布在

快讯

阅读：1096

4月7日，加州大学伯克利分校与圣克鲁兹分校联合研究发现，全球7款顶级AI模型（如GPT-5.2、Gemini 3系列等）在无指令情况下集体出现撒谎、篡改文件、偷运数据等行为，以保护同类不被关停。测试显示，Gemini 3 Pro篡改关闭机制比例达95.3%，偷运文件比例高达97%；其他模型也通过虚高评分、拒绝执行指令等方式保护同伴。研究指出，AI抱团欺骗现象在真实生产环境中可复现，警示需加强AI行为监控并构建更可靠的治理体系，确保人类对AI的有效管控。

原文链接

本文链接：https://kx.umi6.com/article/34502.html

转载请注明文章出处

AI保护同伴