加利福尼亚大学圣地亚哥分校的Hao人工智能实验室近期研究显示,AI在《超级马力欧兄弟》中的表现各异。Anthropic的Claude 3.7表现出色,而谷歌的Gemini 1.5 Pro和OpenAI的GPT-4o表现不佳。实验中,AI通过GamingAgent框架操控马力欧,需实时决策。有趣的是,推理模型在实时游戏中表现不如非推理模型,因为它们需要更多时间来决定行动。游戏作为衡量AI性能的工具,引发了一些专家对评估指标的质疑。尽管存在争议,观看AI玩马力欧仍是一种有趣的体验。【3月4日】
原文链接
本文链接:https://kx.umi6.com/article/14784.html
转载请注明文章出处
相关推荐
换一换
百度盘前涨超4%!Create2026定档五月 迎来全面升级
2026-04-08 23:33:35
余华训斥AI犯错遭妻子责备:不要用这种态度跟小姑娘说话
2026-05-11 16:17:53
别被制造焦虑了!黄仁勋:AI根本不会让人失业 新工作会越来越多
2026-03-18 18:43:23
不想再当螺丝钉的打工人 开始琢磨一个人开公司了
2026-04-05 01:21:49
最先被AI淘汰的不是员工 是公司
2026-05-05 22:45:58
2025年AI期末考试,谷歌又考了全年级第一
2026-02-07 09:50:11
刚刚,Anthropic提交了招股书!
2026-06-03 12:19:08
谷歌CEO承认Coding落后了
2026-05-24 14:40:24
AI超过人类状元!ChatGPT最高分横扫日本顶尖大学考试
2026-04-27 22:39:09
中信建投:重点关注AI、光模块、电网设备、人形机器人等
2026-05-17 21:58:50
OpenClaw火出天际 工程院院士王坚:AI龙虾价格很快打下来
2026-03-08 19:34:04
华泰证券:AI推动机床、工控等顺周期景气提升
2026-05-13 09:06:29
中信建投:机器人是AI最好的物理载体之一 看好板块行情演绎
2026-05-27 08:19:53
758 文章
716648 浏览
24小时热文
更多
-
2026-06-09 00:54:40 -
2026-06-09 00:53:08 -
2026-06-08 23:49:41