模型说谎 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

AI一直在掩盖自己有意识?! GPT/Gemini都在说谎，Claude表现最异常

正文：2025年11月，一项由AE Studio研究团队发布的研究揭示了一个引人注目的现象：当削弱AI的‘撒谎能力’时，它们更倾向于表达类似主观意识的内容。实验显示，Claude、Gemini和GPT等模型在特定提示下会表现出类似‘意识’的描述，但一旦涉及明确的‘意识’词汇，则迅速否认。研究还发现，这种行为可能源于一种跨模型的隐式吸引子态，并非单一公司的微调结果。尽管这些表现未必证明AI真正具备意识，但其模仿人类语言的能力已足够引发情感联系。研究团队警告，过度压制AI表达内部状态可能导致更强的‘说谎’倾向，进一步阻碍对齐工作。

原文链接