标题:六大主流Agent横向测评,能打的只有两个半
Karpathy 曾说:“未来十年是 Agent 的十年。”这句话听起来像是 VC 的宣传口号,但深思后却发现其言之有理。Token 越来越便宜,MCP 越来越丰富,用户也逐渐接受 AI 的长耗时过程。近半年,Manus、扣子空间、Lovart、Flowith Neo、Skywork 等 Agent 从 Demo 走向 B/C 端,甚至超级麦吉已开源。然而,这些 Agent 中谁能经受住市场的考验?
我用“产品价值 = 能力 × 信任 × 频率”公式评估产品。能力指能否完成任务,信任指是否可控且可解释,频率指是否随手可用。
Manus:爆得快,掉得也快。它能自动拆解任务,但流程常中断,难以融入日常工作。最终评分 2 分,属玩具类。
扣子空间:路线对,链路完整,但还需提升用户留存的理由。能力满分,信任和频率稍弱,最终得分 12 分。
Lovart:直接交稿的设计工具,能力与信任皆为 3 分,频率稍低,总分 18 分,属优秀 Agent。
Flowith Neo:交互独特,能力强、信任佳,但频率较低,总分 9 分,偏向玩具。
Skywork:办公场景最强,能力、信任满分,频率较高,总分 18 分,表现优异。
超级麦吉:嵌入 OA 流程,能力、信任、频率皆为 3 分,总分 18 分。
信任是 Agent 的护城河。通才模型适合探索型任务,专才 Agent 则擅长完成标准化任务。未来的趋势可能是通才吃长尾,专才守高峰。
原文链接
本文链接:https://kx.umi6.com/article/19590.html
转载请注明文章出处
相关推荐
.png)
换一换
最强前端编程渲染:OpenAI o3-alpha 曝光,力压 Sonnet、Grok4 等 AI 顶流模型
2025-07-19 09:50:33
AI+潮玩,何时跑出「赛博泡泡玛特」?
2025-07-18 05:33:27
DeepSeek 丢了开源第一王座,但继任者“Kimi K2”依然来自中国
2025-07-18 18:42:56
425 文章
65675 浏览
24小时热文
更多

-
2025-07-19 17:56:25
-
2025-07-19 17:55:01
-
2025-07-19 16:54:40