综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
近日,UC伯克利发布全新AI智能体基准测试“智能体最后的考试”(ALE),让AI在真实软件中完成3D建模、特效合成等实际工作。结果令人意外:在最难档位,公认最强的Claude Fable 5与GPT 5.5均吃零蛋;整体排名中,GPT 5.5包揽冠亚军,逆袭击败了此前在主流评测中碾压它的Fable 5。此外,Fable 5的运行成本高达GPT 5.5的四倍,耗时也更长。该测试覆盖55个行业,冠军通过率仅24%,彻底揭开了顶尖AI“答题学霸、干活露馅”的底牌,表明AI全面取代人类工作仍道阻且长。
原文链接
加载更多
暂无内容