1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:六大主流Agent横向测评,能打的只有两个半

Karpathy 曾说:“未来十年是 Agent 的十年。”这句话听起来像是 VC 的宣传口号,但深思后却发现其言之有理。Token 越来越便宜,MCP 越来越丰富,用户也逐渐接受 AI 的长耗时过程。近半年,Manus、扣子空间、Lovart、Flowith Neo、Skywork 等 Agent 从 Demo 走向 B/C 端,甚至超级麦吉已开源。然而,这些 Agent 中谁能经受住市场的考验?

我用“产品价值 = 能力 × 信任 × 频率”公式评估产品。能力指能否完成任务,信任指是否可控且可解释,频率指是否随手可用。

Manus:爆得快,掉得也快。它能自动拆解任务,但流程常中断,难以融入日常工作。最终评分 2 分,属玩具类。

扣子空间:路线对,链路完整,但还需提升用户留存的理由。能力满分,信任和频率稍弱,最终得分 12 分。

Lovart:直接交稿的设计工具,能力与信任皆为 3 分,频率稍低,总分 18 分,属优秀 Agent。

Flowith Neo:交互独特,能力强、信任佳,但频率较低,总分 9 分,偏向玩具。

Skywork:办公场景最强,能力、信任满分,频率较高,总分 18 分,表现优异。

超级麦吉:嵌入 OA 流程,能力、信任、频率皆为 3 分,总分 18 分。

信任是 Agent 的护城河。通才模型适合探索型任务,专才 Agent 则擅长完成标准化任务。未来的趋势可能是通才吃长尾,专才守高峰。

原文链接
本文链接:https://kx.umi6.com/article/19590.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
最强前端编程渲染:OpenAI o3-alpha 曝光,力压 Sonnet、Grok4 等 AI 顶流模型
2025-07-19 09:50:33
AI+潮玩,何时跑出「赛博泡泡玛特」?
2025-07-18 05:33:27
DeepSeek 丢了开源第一王座,但继任者“Kimi K2”依然来自中国
2025-07-18 18:42:56
24小时热文
更多
扫一扫体验小程序