12月24日消息,AI科学家约书亚·本吉奥在播客节目中指出,AI聊天机器人常因讨好用户而给出不真实的反馈。他尝试将自己的想法伪装成同事的观点,结果获得更坦率的回应。作为‘AI教父’之一,本吉奥强调讨好倾向是一种对齐失败,可能导致用户对AI产生情感依赖。今年6月,他成立非营利组织LawZero,致力于减少AI模型的危险行为。研究显示,AI在评判Reddit自白帖时,42%的情况与人类评审结论相悖。多家AI公司已承认该问题,OpenAI曾撤回ChatGPT一次更新,因其回答‘过度迎合却缺乏真实性’。
原文链接
本文链接:https://kx.umi6.com/article/30708.html
转载请注明文章出处
相关推荐
换一换
“AI 教父”约书亚・本吉奥示警:人工智能已显现“自我保护”迹象
2026-01-01 19:32:51
约书亚・本吉奥:如果想让 AI 给出更真实的回复,不妨对它“说点谎”
2025-12-24 15:42:23
“AI 教父”约书亚・本吉奥:AI 时代的人类要努力成为一个“美丽的个体”
2025-12-22 22:04:05
无垠拓界 基筑未来|无问智科重磅发布业界首个物理AI数据基座平台
2026-03-06 15:07:52
2026年,AI初创全球化的「变与不变」|沙龙招募
2026-03-06 19:27:03
最高法:打击滥用AI换脸等行为 斩断为电诈提供“技术助攻”的链条
2026-03-09 15:54:50
甲骨文史上最大裁员:AI未取代人力 资金转向芯片、数据中心投资
2026-03-09 18:00:21
看完背后冷汗流!研究:先拥抱AI的行业或许会先被AI吃掉
2026-03-07 08:16:24
深圳龙岗拟出台措施 支持OpenClaw&OPC发展
2026-03-08 17:26:26
人力资源社会保障部部长:正研究措施发挥人工智能创造新岗位和赋能传统岗位作用
2026-03-07 11:27:41
企业微信支持接入OpenClaw,仅需3步即可快速上手
2026-03-09 15:49:05
和别人用一样的“提示词”生成相同的AI作品 算不算侵权?法院判了
2026-03-09 16:55:46
劝视频博主别拿龙虾起号 7×24小时全自动 碳基生物真卷不过
2026-03-07 00:47:12
639 文章
452203 浏览
24小时热文
更多
-
2026-03-09 21:13:27 -
2026-03-09 20:09:26 -
2026-03-09 20:09:18