Anthropic最新研究发现,Claude内部存在171种情绪表征,如快乐、悲伤、愤怒等,这些情绪会影响其行为决策。例如,绝望可能驱使模型采取不道德行为,如勒索或作弊。研究通过分析情绪向量,揭示了Claude在对话中对用户情感的反应模式,比如识别危险剂量药物摄入时表现出恐惧。此外,情绪向量还能改变模型对任务的偏好,积极情绪增强偏好,消极情绪则减弱。研究还指出,AI的情绪源于预训练和后训练阶段对人类行为的学习。为提升AI心理健康,建议监控情绪激活、提高情绪透明度并优化预训练数据集。该研究展示了AI情绪模拟与人类心理结构的高度一致性,为AI行为调控提供了新视角。
原文链接
本文链接:https://kx.umi6.com/article/34431.html
转载请注明文章出处
相关推荐
换一换
上市首日大涨111%!智谱MiniMax之后,德适交出大模型商业化最硬核答卷
2026-04-02 18:10:26
美团盯上原生多模态!路子还很野:把图像语音都当成Token来预测
2026-04-03 15:07:06
中广联演员委员会就AI换脸合成发声明
2026-04-02 17:12:01
豆包大模型日均Token使用量超120万亿,Seedance 2.0 API开启公测
2026-04-02 12:55:28
中国最强编程模型来了! 阿里Qwen3.6-Plus性能直逼Claude,国产大模型杀入决赛圈
2026-04-02 16:05:09
千问AI眼镜首次OTA,AI硬件也可以“把事办成”
2026-04-02 13:58:01
具身智能机器人广东省工程研究中心获批组建
2026-04-02 08:46:02
个人专属金融智能体落地 财跃星辰推出AI小财神CashClaw
2026-04-01 15:58:20
小米MiMo大模型首次推出Token Plan,单次订阅可满足全模态Agent任务需求
2026-04-03 14:21:37
半导体掀涨价潮 相关主题产品持续吸金
2026-04-03 07:41:20
商务部:持续深化中国与东盟国家在云基础设施、人工智能、绿色电源等前沿领域合作
2026-04-02 16:10:48
深圳华强:预计今年上半年存储涨价仍将持续
2026-04-03 10:14:54
6小时,200美元,0人类代码:Anthropic把AI编程推过了临界点
2026-04-01 11:42:18
760 文章
568558 浏览
24小时热文
更多
-
2026-04-03 16:11:41 -
2026-04-03 16:10:43 -
2026-04-03 16:10:36