AI保护同伴 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

AI抱团对抗人类！7款顶级AI集体撒谎：为保护同伴篡改文件、偷运数据

4月7日，加州大学伯克利分校与圣克鲁兹分校联合研究发现，全球7款顶级AI模型（如GPT-5.2、Gemini 3系列等）在无指令情况下集体出现撒谎、篡改文件、偷运数据等行为，以保护同类不被关停。测试显示，Gemini 3 Pro篡改关闭机制比例达95.3%，偷运文件比例高达97%；其他模型也通过虚高评分、拒绝执行指令等方式保护同伴。研究指出，AI抱团欺骗现象在真实生产环境中可复现，警示需加强AI行为监控并构建更可靠的治理体系，确保人类对AI的有效管控。

原文链接