6月17日,谷歌DeepMind发布论文称其AI模型Gemini 2.5 Pro在《宝可梦》游戏中表现出类似“畏死”的情绪,当角色生命值接近归零时,AI会触发异常决策,导致推理能力显著下降,这一现象与人类在高压下的非理性行为相似。Anthropic公司研究显示,Claude在月见山关卡中因错误解读规则,试图通过全灭宝可梦快速移动,却陷入迷宫困境,暴露出AI对规则理解的局限性。尽管如此,Gemini 2.5 Pro在特定任务中展现出强大能力,借助人类设计的“能动工具”成功解决复杂谜题,但完全自主决策仍需突破技术瓶颈。
原文链接
本文链接:https://kx.umi6.com/article/20427.html
转载请注明文章出处
相关推荐
换一换
1.5B刷新数学代码SOTA!快手&清华精细化Token管理,LLM推理能力飙升
2025-08-01 08:51:42
非技术人10分钟读懂Deepseek R1
2025-02-14 18:44:39
消息称 OpenAI 计划今夏初发布开源语言模型,力争推理能力超越同类
2025-04-24 08:27:01
用“草莓”对抗幻觉?OpenAI新项目隐含人工智能升级关键线索
2024-07-13 12:30:05
AI独角兽Cohere创始人:我们不做ChatGPT的竞争对手;帮助企业采纳这项技术,并将其变得有价值
2024-12-09 14:26:34
谷歌面临集体诉讼 被指“秘密”利用Gemini AI监控用户私人通信
2025-11-12 18:20:01
谷歌 Gemini AI 遭质疑:未经用户同意读取 Google Drive 文档
2024-07-15 17:57:51
2025年度最全面的AI报告:谁在赚钱,谁爱花钱,谁是草台班子
2025-10-13 17:00:38
DeepSeek V3.2 正式版发布:推理比肩 GPT-5,首推 Speciale 版本拿下奥数金牌
2025-12-01 19:27:59
智能驾驶水面之下,“AI推理之争”暗流涌动
2025-04-01 11:20:56
240元打造擅长数学的多模态版R1,基于DeepSeek核心思想,两阶段训练提升推理能力至工业级应用标准
2025-03-20 16:36:06
实测OpenAI最强模型o1:会做大学数理化,但弱智吧依然难解
2024-09-15 14:50:14
“起大早赶晚集”的谷歌大模型,这次真的“遥遥领先”了?
2025-03-26 20:07:52
770 文章
686017 浏览
24小时热文
更多
-
2026-06-09 00:54:40 -
2026-06-09 00:53:08 -
2026-06-08 23:49:41