六大主流Agent横向测评，能打的只有两个半

2025-06-02 18:38:10

电子诗篇

发布在

科普

阅读：1550

标题：六大主流Agent横向测评，能打的只有两个半

Karpathy 曾说：“未来十年是 Agent 的十年。”这句话听起来像是 VC 的宣传口号，但深思后却发现其言之有理。Token 越来越便宜，MCP 越来越丰富，用户也逐渐接受 AI 的长耗时过程。近半年，Manus、扣子空间、Lovart、Flowith Neo、Skywork 等 Agent 从 Demo 走向 B/C 端，甚至超级麦吉已开源。然而，这些 Agent 中谁能经受住市场的考验？

我用“产品价值 = 能力 × 信任 × 频率”公式评估产品。能力指能否完成任务，信任指是否可控且可解释，频率指是否随手可用。

Manus：爆得快，掉得也快。它能自动拆解任务，但流程常中断，难以融入日常工作。最终评分 2 分，属玩具类。

扣子空间：路线对，链路完整，但还需提升用户留存的理由。能力满分，信任和频率稍弱，最终得分 12 分。

Lovart：直接交稿的设计工具，能力与信任皆为 3 分，频率稍低，总分 18 分，属优秀 Agent。

Flowith Neo：交互独特，能力强、信任佳，但频率较低，总分 9 分，偏向玩具。

Skywork：办公场景最强，能力、信任满分，频率较高，总分 18 分，表现优异。

超级麦吉：嵌入 OA 流程，能力、信任、频率皆为 3 分，总分 18 分。

信任是 Agent 的护城河。通才模型适合探索型任务，专才 Agent 则擅长完成标准化任务。未来的趋势可能是通才吃长尾，专才守高峰。

原文链接

本文链接：https://kx.umi6.com/article/19590.html

转载请注明文章出处

Agent测评