近日,普林斯顿大学推出CEO-Bench测试,让14个AI模型在500天内运营本金100万美元的虚拟初创公司。结果惨烈,10家公司“破产”,仅3个大模型实现盈利。其中,Fable 5以4715万美元断层夺冠,Opus 4.8与GPT-5.5分列二三。令人意外的是,第四名竟是未使用大模型的纯规则算法,赚取1576万美元,击败众多知名模型。研究指出,商业决策中“探索大于谨慎”,且通用编程Agent并非万能,亟需垂直场景深度适配。尽管AI执行力强大,但制定核心战略的直觉仍属于人类。
原文链接
本文链接:https://kx.umi6.com/article/36743.html
转载请注明文章出处
相关推荐
换一换
如何用AI构建个人知识库?
2025-07-22 16:35:29
大厂「AI」智能体,等待 DeepSeek 时刻
2025-07-31 11:05:08
微软高管:AI Agent规模化部署或增加软件收入
2026-04-13 09:51:22
Cursor 9秒删库搞崩公司,然后…写了份检讨
2026-04-28 17:27:55
零一万物押注企业级Agent,李开复也做起“推销员”
2025-07-23 11:47:50
ChatGPT之父:若OpenAI不是第一家由AI执掌的公司 我将感到羞愧!
2025-11-06 10:54:45
MiniMax发布命令行工具MMX-CLI
2026-04-09 12:08:20
我把Agent拉进群聊,它竟然开始带队干活?全球首个AI社交通用平台来了!
2026-02-14 17:29:25
AI Agent ,风口上的「猪」?
2025-08-26 10:40:43
李开复:CEO 将成为 AI 总指挥,未来将出现一人独角兽公司
2025-11-03 11:18:07
TTC完成A轮千万美元融资,厚雪资本领投、百度战略投资
2026-01-30 13:38:58
从风口到风暴,Manus的130天
2025-07-14 10:17:22
全球最大云厂商亚马逊 AWS,将“最牛马”的工作交给了 AI Agent
2025-12-07 18:39:34
686 文章
666988 浏览
24小时热文
更多
-
2026-06-29 17:43:26 -
2026-06-29 17:41:47 -
2026-06-29 16:42:03