
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
加利福尼亚大学圣地亚哥分校的Hao人工智能实验室近期研究显示,AI在《超级马力欧兄弟》中的表现各异。Anthropic的Claude 3.7表现出色,而谷歌的Gemini 1.5 Pro和OpenAI的GPT-4o表现不佳。实验中,AI通过GamingAgent框架操控马力欧,需实时决策。有趣的是,推理模型在实时游戏中表现不如非推理模型,因为它们需要更多时间来决定行动。游戏作为衡量AI性能的工具,引发了一些专家对评估指标的质疑。尽管存在争议,观看AI玩马力欧仍是一种有趣的体验。【3月4日】
原文链接
加载更多

暂无内容