加利福尼亚大学圣地亚哥分校的Hao人工智能实验室近期研究显示,AI在《超级马力欧兄弟》中的表现各异。Anthropic的Claude 3.7表现出色,而谷歌的Gemini 1.5 Pro和OpenAI的GPT-4o表现不佳。实验中,AI通过GamingAgent框架操控马力欧,需实时决策。有趣的是,推理模型在实时游戏中表现不如非推理模型,因为它们需要更多时间来决定行动。游戏作为衡量AI性能的工具,引发了一些专家对评估指标的质疑。尽管存在争议,观看AI玩马力欧仍是一种有趣的体验。【3月4日】
原文链接
本文链接:https://kx.umi6.com/article/14784.html
转载请注明文章出处
相关推荐
.png)
换一换
在这个世界级编程竞赛中,这可能是人类最后一次战胜AI了
2025-07-17 12:24:05
荣耀CEO李健:AI正在完成从“思考”到“行动”的关键跨越
2025-06-19 10:49:26
李飞飞:高校学生应追逐AI“北极星”问题
2025-07-08 16:49:13
459 文章
83788 浏览
24小时热文
更多

-
2025-07-20 08:01:35
-
2025-07-19 22:57:32
-
2025-07-19 21:58:20