标题:AI Agent爆发前的黎明:Manus不够好,但天快亮了
一、测评Manus
硅谷101团队拿到了Manus的邀请码,测试结果显示效果未达预期。Jacob(后期负责人)提到,Manus在查找信息来源时较GPT更聪明,但简单任务耗时半小时才完成。陈茜(联合创始人)指出,其整理分镜稿的审美像实习生,且卡顿严重。泓君提到整理微信文字稿时出现幻觉问题,王可倚则发现需求执行中途跑偏。
开发者Nathan Wang通过“准确度”“可用度”“完成度”三个指标测评Manus,涵盖“研究”“教育”“生活”“数据分析”“创意性工作”五类任务。研究和教育表现较好,分别为4分和4.5分,但生活、数据分析、趣味性得分较低,分别为3.5分、2.5分、2.5分。Manus整合信息能力不足,逻辑和综合能力有待提升。尽管如此,它仍展示了虚拟世界中AI代理作为机器人助手的潜力,但尚处早期阶段,需持续迭代。
二、AI Agent技术发展史
AI Agent需具备逻辑推理、记忆和工具使用能力。2022年,ReAct框架结合推理和行为,使大模型能执行任务。GPT-4和ChatGPT插件的发布显著提升了推理能力。2023年,Claude和OpenAI相继提升上下文窗口容量,增强了记忆能力。工具使用方面,Simular和Claude的“computer use”功能让AI代理操控电脑能力大幅提升。
三、硅谷AI Agent公司版图
当前AI Agent产品分为通用型、基础设施与框架、垂直化应用三类。LangChain、Pinecone等工具包助力开发者构建agent。编程领域,GitHub Copilot、Devin、Cursor等表现亮眼,客服与销售领域,Decagon和Clay分别展现高效能。此外,AI agent还在商业调研、科研、供应链优化、医疗健康等领域广泛应用。
四、AI Agent的未来
Manus引发热潮后,OpenAI推出简化agent开发的工具,标志着精彩才刚刚开始。ToB端AI应用已见成效,ToC端今年有望成为元年。未来,AI agent将在垂直领域深耕细作,逐步走向大一统状态。
.png)

-
2025-07-20 23:09:27
-
2025-07-20 22:09:17
-
2025-07-20 21:10:03