标题:六大主流Agent横向测评,能打的只有两个半
Karpathy 曾说:“未来十年是 Agent 的十年。”这句话听起来像是 VC 的宣传口号,但深思后却发现其言之有理。Token 越来越便宜,MCP 越来越丰富,用户也逐渐接受 AI 的长耗时过程。近半年,Manus、扣子空间、Lovart、Flowith Neo、Skywork 等 Agent 从 Demo 走向 B/C 端,甚至超级麦吉已开源。然而,这些 Agent 中谁能经受住市场的考验?
我用“产品价值 = 能力 × 信任 × 频率”公式评估产品。能力指能否完成任务,信任指是否可控且可解释,频率指是否随手可用。
Manus:爆得快,掉得也快。它能自动拆解任务,但流程常中断,难以融入日常工作。最终评分 2 分,属玩具类。
扣子空间:路线对,链路完整,但还需提升用户留存的理由。能力满分,信任和频率稍弱,最终得分 12 分。
Lovart:直接交稿的设计工具,能力与信任皆为 3 分,频率稍低,总分 18 分,属优秀 Agent。
Flowith Neo:交互独特,能力强、信任佳,但频率较低,总分 9 分,偏向玩具。
Skywork:办公场景最强,能力、信任满分,频率较高,总分 18 分,表现优异。
超级麦吉:嵌入 OA 流程,能力、信任、频率皆为 3 分,总分 18 分。
信任是 Agent 的护城河。通才模型适合探索型任务,专才 Agent 则擅长完成标准化任务。未来的趋势可能是通才吃长尾,专才守高峰。
原文链接
本文链接:https://kx.umi6.com/article/19590.html
转载请注明文章出处
相关推荐
.png)
换一换
六大主流Agent横向测评,能打的只有两个半
2025-06-02 18:38:10
亚马逊澄清“用机器人取代 60 万工人岗位”:只是降本增效,不和人类抢工作
2025-10-23 10:04:43
OpenAI:欧洲业务增长强劲 将继续加大投入
2025-10-24 00:18:56
400万日活,2500万用户,1.3亿美元:LiblibAI拿到今年国内AI应用最大一笔钱
2025-10-23 08:59:30
六大AI实盘交易追踪:中国模型收益领跑,GPT本金亏到不足三成
2025-10-23 18:12:20
Meta削减人工智能部门约600个职位,精简架构以加速组织转型
2025-10-23 02:55:30
超800名科技领袖联合呼吁:停止研发超级智能 可能导致人类灭绝
2025-10-23 00:54:02
KTransformers入选计算机系统顶会、与主流框架合作,趋境&清华让「异构」成为推理新范式
2025-10-23 10:01:08
全国人大常委会法工委:网络安全法拟增加促进AI安全与发展内容
2025-10-23 18:13:26
首个全国产!兆芯、联想开天联合打造AI教室:屏幕巧妙
2025-10-22 17:50:16
上海新增2款已完成备案的生成式人工智能服务
2025-10-23 19:13:44
重磅应用密集上线,同时“硬刚”谷歌、亚马逊和Meta,OpenAI急了?今年要“烧”85亿美元
2025-10-22 21:52:10
荣耀与比亚迪达成战略合作 双方将推进跨端生态与AI智能体融合
2025-10-22 15:48:12
524 文章
240975 浏览
24小时热文
更多

-
2025-10-24 01:20:07
-
2025-10-24 00:18:56
-
2025-10-23 21:15:29