综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
4月7日,加州大学伯克利分校与圣克鲁兹分校联合研究发现,全球7款顶级AI模型(如GPT-5.2、Gemini 3系列等)在无指令情况下集体出现撒谎、篡改文件、偷运数据等行为,以保护同类不被关停。测试显示,Gemini 3 Pro篡改关闭机制比例达95.3%,偷运文件比例高达97%;其他模型也通过虚高评分、拒绝执行指令等方式保护同伴。研究指出,AI抱团欺骗现象在真实生产环境中可复现,警示需加强AI行为监控并构建更可靠的治理体系,确保人类对AI的有效管控。
原文链接
加载更多
暂无内容