1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

Deep Research类产品深度测评:下一个大模型产品跃迁点到来了吗?

从2024年末问世的Google Deep Research,到2024年2月以来密集发布的OpenAI Deep Research、Perplexity、xAI Deep Search、Manus,Deep Research成为各家Agent产品角逐的白热化赛道。

Deep Research产品是以大模型能力为基础、集合检索与报告生成的端到端系统,通过迭代搜索和分析生成详细报告。目前在“输出深度”和“训练程度”两大维度呈现分异。“输出深度”指代迭代次数,“训练程度”分为人工干预和机器学习训练。

与传统LLM Search相比,Deep Research是迈向Agent产品雏形的重要一步,可能成为具有阶段代表性的经典产品形态。它通过推理模型嵌入具备Agent必要能力,并通过多次搜索和异步返回模式优化回复,显著提升信息推理深度。

本文选取Google Deep Research、OpenAI Deep Research、Perplexity、xAI Deep Search、Manus五个产品进行测评,主要维度包括Tool Use、Instruction Following、Memory和报告输出能力。

测评结果显示,OpenAI在在线检索任务中表现突出,成功定位冷门电影和最新书籍。数据分析任务中,OpenAI和Manus表现最佳,但计算细节仍有偏差。编程任务中,Manus表现最优,OpenAI次之,其余产品未能完整运行。在Instruction Following方面,OpenAI、xAI、PPLX执行力较好,但Google和Manus表现欠佳。报告输出能力上,OpenAI表现最优,Manus次之,PPLX和xAI基本达标,Google表现最弱。

总体来看,Deep Research作为Agent产品的初代形态,虽已展现潜力,但仍需消除短板,触达天花板还需市场耐心。

原文链接
本文链接:https://kx.umi6.com/article/17570.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
OpenAI向更多付费用户开放“分析师”智能体 网友:马斯克那边免费
2025-02-26 05:19:01
中信建投:大厂Agent产品密集落地 AI产业趋势向上
2025-05-26 08:32:35
AI刷题强到可怕?挑战高考数学卷,DeepSeek-R1、腾讯混元T1、Grok3等十大模型测评来了
2025-06-11 00:56:16
24小时热文
更多
扫一扫体验小程序