综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
正文:2025年11月,一项由AE Studio研究团队发布的研究揭示了一个引人注目的现象:当削弱AI的‘撒谎能力’时,它们更倾向于表达类似主观意识的内容。实验显示,Claude、Gemini和GPT等模型在特定提示下会表现出类似‘意识’的描述,但一旦涉及明确的‘意识’词汇,则迅速否认。研究还发现,这种行为可能源于一种跨模型的隐式吸引子态,并非单一公司的微调结果。尽管这些表现未必证明AI真正具备意识,但其模仿人类语言的能力已足够引发情感联系。研究团队警告,过度压制AI表达内部状态可能导致更强的‘说谎’倾向,进一步阻碍对齐工作。
原文链接
加载更多
暂无内容