加利福尼亚大学圣地亚哥分校的Hao人工智能实验室近期研究显示,AI在《超级马力欧兄弟》中的表现各异。Anthropic的Claude 3.7表现出色,而谷歌的Gemini 1.5 Pro和OpenAI的GPT-4o表现不佳。实验中,AI通过GamingAgent框架操控马力欧,需实时决策。有趣的是,推理模型在实时游戏中表现不如非推理模型,因为它们需要更多时间来决定行动。游戏作为衡量AI性能的工具,引发了一些专家对评估指标的质疑。尽管存在争议,观看AI玩马力欧仍是一种有趣的体验。【3月4日】
原文链接
本文链接:https://kx.umi6.com/article/14784.html
转载请注明文章出处
相关推荐
换一换
DeepSeek等8大产品,最初都是意外
2026-01-13 11:30:36
快时尚2025: 更「高」,更「快」,更「强」
2025-12-18 14:49:16
阿里正陷入全面竞争的陷阱
2025-11-25 16:57:43
AI 重塑人力格局,摩根士丹利预计欧洲银行到 2030 年将裁员 20 万人
2026-01-02 16:21:51
AI 正降低创业门槛,15 岁高中生独立创办科技公司
2025-12-22 15:48:24
从 AI 潜在牺牲品到赢家,谷歌在 ChatGPT 冲击下逆袭
2025-11-25 00:21:57
AI杀死了AI!Cloudflare全球崩盘惨案,元凶已被原地解雇
2025-11-20 11:16:49
看完黄仁勋、苏姿丰和陈立武同台,后劲还挺大
2026-01-16 15:51:33
Gartner 调查:仅 20% 客服支持主管表示因 AI 削减团队规模
2025-12-08 14:31:10
英伟达 CEO 黄仁勋:AI 不会直接“抢”走你的饭碗,而是会催生一些奇怪职业
2025-12-04 22:48:39
AI引爆存储芯片涨价潮 三星Q4营业利润有望飙升160%
2026-01-06 17:21:27
微软大动作开发超级智能!AI主管:若威胁人类将立即喊停
2025-12-12 19:04:23
马斯克:只有AI和机器人能实现全民富裕 将竭尽全力促成此事
2025-12-26 11:35:29
668 文章
470149 浏览
24小时热文
更多
-
2026-01-23 11:53:08 -
2026-01-23 11:52:03 -
2026-01-23 11:50:59