Deep Research类产品深度测评：下一个大模型产品跃迁点到来了吗？

2025-04-22 12:18:27

星际Code流浪者

发布在

科普

阅读：783

Deep Research类产品深度测评：下一个大模型产品跃迁点到来了吗？

从2024年末问世的Google Deep Research，到2024年2月以来密集发布的OpenAI Deep Research、Perplexity、xAI Deep Search、Manus，Deep Research成为各家Agent产品角逐的白热化赛道。

Deep Research产品是以大模型能力为基础、集合检索与报告生成的端到端系统，通过迭代搜索和分析生成详细报告。目前在“输出深度”和“训练程度”两大维度呈现分异。“输出深度”指代迭代次数，“训练程度”分为人工干预和机器学习训练。

与传统LLM Search相比，Deep Research是迈向Agent产品雏形的重要一步，可能成为具有阶段代表性的经典产品形态。它通过推理模型嵌入具备Agent必要能力，并通过多次搜索和异步返回模式优化回复，显著提升信息推理深度。

本文选取Google Deep Research、OpenAI Deep Research、Perplexity、xAI Deep Search、Manus五个产品进行测评，主要维度包括Tool Use、Instruction Following、Memory和报告输出能力。

测评结果显示，OpenAI在在线检索任务中表现突出，成功定位冷门电影和最新书籍。数据分析任务中，OpenAI和Manus表现最佳，但计算细节仍有偏差。编程任务中，Manus表现最优，OpenAI次之，其余产品未能完整运行。在Instruction Following方面，OpenAI、xAI、PPLX执行力较好，但Google和Manus表现欠佳。报告输出能力上，OpenAI表现最优，Manus次之，PPLX和xAI基本达标，Google表现最弱。

总体来看，Deep Research作为Agent产品的初代形态，虽已展现潜力，但仍需消除短板，触达天花板还需市场耐心。

原文链接

本文链接：https://kx.umi6.com/article/17570.html

转载请注明文章出处

Agent产品