标题:爆火了大半年,Agent到底能干好多少活
今年上半年,AI Agent成为热门话题,但人们也在问:它到底强在哪?陪聊、写论文、画画固然惊艳,但成年人的核心能力是解决问题,AI同样如此。
伴随Manus的爆红,“Chatbot下岗,Agent上位”成为趋势。Agent一词源自拉丁语“Agere”,意为“行动”。与Chatbot的线性对话不同,Agent以任务链方式运作:用户输入目标后,系统自动拆解任务、调用工具完成多步操作,无需频繁干预。如果说大模型是超强咖啡机,Agent就是训练有素的咖啡师,能协调全流程,提供一站式服务。
然而,现实复杂得多。办公软件、内容平台各有网页版和API权限,Agent难以预先适配。浏览器曾被视为解决方案,OpenAI的Operator和ChatGPT Agent都在尝试,但Manus更进一步,通过可视化面板展示每一步执行过程,极大提升了用户信任。
通用型Agent率先跑出,因其瞄准“大而全”方向,如图像生成、PPT制作等,易于快速落地和技术展示。但多数初创公司的产品只是模型套壳,缺乏壁垒。细节创新变得关键,例如Manus预估任务时长,Genspark让AI替你打电话分手或辞职。
尽管如此,通用Agent常被比作“瑞士军刀”——看似全能,实则无一精通。市场真正需要的是像“好菜刀”一样的垂类Agent,聚焦具体场景,如客服、医疗、法律等。
未来交互将围绕Agent展开,强调记忆、主动提示、路径规划等能力。这种新范式被称为AX(Agent Experience),注重可控性、可预期性和可演进性。大厂和初创公司分别通过“打补丁”和从零构建的方式探索Agent,前者依托成熟生态升级体验,后者灵活切入垂直痛点。
Agent为自动化装上了“大脑”,融合语言理解与推理能力,形成智能执行链。但通用Agent可能只是过渡,最终会被嵌入式、垂直化Agent取代。欣慰的是,至少有些事,现在不用人类动手了。
.png)

-
2025-08-03 22:44:26
-
2025-08-03 22:43:57
-
2025-08-03 22:43:19