超级马力欧兄弟

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

AI 玩《超级马力欧兄弟》：Claude 3.7 操作最溜，推理模型表现不佳

加利福尼亚大学圣地亚哥分校的Hao人工智能实验室近期研究显示，AI在《超级马力欧兄弟》中的表现各异。Anthropic的Claude 3.7表现出色，而谷歌的Gemini 1.5 Pro和OpenAI的GPT-4o表现不佳。实验中，AI通过GamingAgent框架操控马力欧，需实时决策。有趣的是，推理模型在实时游戏中表现不如非推理模型，因为它们需要更多时间来决定行动。游戏作为衡量AI性能的工具，引发了一些专家对评估指标的质疑。尽管存在争议，观看AI玩马力欧仍是一种有趣的体验。【3月4日】

原文链接