6月17日,谷歌DeepMind发布论文称其AI模型Gemini 2.5 Pro在《宝可梦》游戏中表现出类似“畏死”的情绪,当角色生命值接近归零时,AI会触发异常决策,导致推理能力显著下降,这一现象与人类在高压下的非理性行为相似。Anthropic公司研究显示,Claude在月见山关卡中因错误解读规则,试图通过全灭宝可梦快速移动,却陷入迷宫困境,暴露出AI对规则理解的局限性。尽管如此,Gemini 2.5 Pro在特定任务中展现出强大能力,借助人类设计的“能动工具”成功解决复杂谜题,但完全自主决策仍需突破技术瓶颈。
原文链接
本文链接:https://kx.umi6.com/article/20427.html
转载请注明文章出处
相关推荐
.png)
换一换
谷歌开始向旗下智能音箱推出 Gemini AI 新版语音助理,首批覆盖 Nest Audio / 第二代 Mini
2024-12-14 10:43:50
OpenAI o1 模型登场:开启 AI 通用复杂推理新篇章,模拟人类思考、处理问题
2024-09-13 08:08:03
第一个国产中文o1来了,直接数学竞赛题伺候!
2024-11-27 16:56:40
AI进步放缓、遭遇瓶颈?OpenAI等头部公司:不存在
2024-11-29 17:58:36
陈丹琦团队图表解读新基准:新王Claude3.5刚及格,但已是模型最强推理表现
2024-06-28 22:10:00
谷歌 CEO 皮查伊认为 Gemini 能力“市面最强”,已超越竞争对手
2025-01-16 21:01:16
天工大模型 4.0 o1 版 / 4o 版上线,App 及网页可免费使用
2025-01-06 11:23:41
“起大早赶晚集”的谷歌大模型,这次真的“遥遥领先”了?
2025-03-26 20:07:52
谷歌 Gemini AI 被曝给出离谱回应:让用户“去死”
2024-11-18 17:31:04
AI独角兽Cohere创始人:我们不做ChatGPT的竞争对手;帮助企业采纳这项技术,并将其变得有价值
2024-12-09 14:26:34
谷歌打磨 Gemini AI 技能:扩充支持文件类型、提高文档洞察力
2024-08-31 13:10:37
谷歌 Gemini 2.0 Flash 系列 AI 模型登场,编程和推理性能迈上新台阶
2025-02-06 07:23:35
清华&通院推出”绝对零”训练法,零外部数据大模型自我博弈解锁推理能力
2025-05-12 17:37:13
514 文章
182765 浏览
24小时热文
更多

-
2025-09-07 00:40:01
-
2025-09-06 23:39:46
-
2025-09-06 22:39:24