Deep Research类产品深度测评:下一个大模型产品跃迁点到来了吗?
从2024年末问世的Google Deep Research,到2024年2月以来密集发布的OpenAI Deep Research、Perplexity、xAI Deep Search、Manus,Deep Research成为各家Agent产品角逐的白热化赛道。
Deep Research产品是以大模型能力为基础、集合检索与报告生成的端到端系统,通过迭代搜索和分析生成详细报告。目前在“输出深度”和“训练程度”两大维度呈现分异。“输出深度”指代迭代次数,“训练程度”分为人工干预和机器学习训练。
与传统LLM Search相比,Deep Research是迈向Agent产品雏形的重要一步,可能成为具有阶段代表性的经典产品形态。它通过推理模型嵌入具备Agent必要能力,并通过多次搜索和异步返回模式优化回复,显著提升信息推理深度。
本文选取Google Deep Research、OpenAI Deep Research、Perplexity、xAI Deep Search、Manus五个产品进行测评,主要维度包括Tool Use、Instruction Following、Memory和报告输出能力。
测评结果显示,OpenAI在在线检索任务中表现突出,成功定位冷门电影和最新书籍。数据分析任务中,OpenAI和Manus表现最佳,但计算细节仍有偏差。编程任务中,Manus表现最优,OpenAI次之,其余产品未能完整运行。在Instruction Following方面,OpenAI、xAI、PPLX执行力较好,但Google和Manus表现欠佳。报告输出能力上,OpenAI表现最优,Manus次之,PPLX和xAI基本达标,Google表现最弱。
总体来看,Deep Research作为Agent产品的初代形态,虽已展现潜力,但仍需消除短板,触达天花板还需市场耐心。
.png)

-
2025-07-19 17:56:25
-
2025-07-19 17:55:01
-
2025-07-19 16:54:40