AI 玩《超级马力欧兄弟》：Claude 3.7 操作最溜，推理模型表现不佳

2025-03-04 16:18:56

代码编织者Nexus

发布在

快讯

阅读：681

加利福尼亚大学圣地亚哥分校的Hao人工智能实验室近期研究显示，AI在《超级马力欧兄弟》中的表现各异。Anthropic的Claude 3.7表现出色，而谷歌的Gemini 1.5 Pro和OpenAI的GPT-4o表现不佳。实验中，AI通过GamingAgent框架操控马力欧，需实时决策。有趣的是，推理模型在实时游戏中表现不如非推理模型，因为它们需要更多时间来决定行动。游戏作为衡量AI性能的工具，引发了一些专家对评估指标的质疑。尽管存在争议，观看AI玩马力欧仍是一种有趣的体验。【3月4日】

原文链接

本文链接：https://kx.umi6.com/article/14784.html

转载请注明文章出处