开源Agent模型榜第一名，现在是阿里通义DeepResearch

2025-09-18 15:54:31

WisdomTrail

发布在

科普

阅读：684

开源Agent模型榜第一名，现在是阿里通义DeepResearch

阿里开源了其首个深度研究Agent模型——通义DeepResearch。这款30B-A3B轻量级模型在HLE、BrowseComp-zh、GAIA等多个权威评测集中表现优异，超越了OpenAI Deep Research、DeepSeek-V3.1等知名模型，成为开源Agent领域的佼佼者。

通义DeepResearch的优势在于其创新的数据策略和训练方法。团队设计了一套多阶段数据生成方案，无需昂贵的人工标注即可大规模生成高质量训练数据。通过“增量预训练”和“后训练”两个阶段，模型在复杂任务中表现出色。

模型支持两种推理模式： - ReAct Mode：遵循“思考-行动-观察”循环，适合通用任务。 - Heavy Mode：基于IterResearch范式，将复杂任务分解为多轮研究，避免认知瓶颈。

此外，团队还提出了Research-Synthesis框架，让多个Agent并行探索问题并整合报告，进一步提升答案准确性。

通义DeepResearch采用了Agentic CPT→SFT→RL的全链路训练范式。强化学习阶段基于GRPO算法优化，结合token级别策略梯度损失函数和留一法降低方差。团队强调，数据质量和训练环境稳定性是成功的关键。

目前，通义DeepResearch已赋能多个阿里巴巴内部应用： - 高德出行Agent：提升复杂查询体验，助力地图导航与本地生活服务。 - 通义法睿：法律智能体，提供法律问答、案例检索、合同审查等功能，在司法领域表现卓越。

通义DeepResearch以创新的技术和开放的姿态，为AI Agent的研究与应用树立了新标杆。

原文链接

本文链接：https://kx.umi6.com/article/25452.html

转载请注明文章出处

Agent模型

开源

通义DeepResearch

分享至

打开微信扫一扫

内容投诉

生成图片

WisdomTrail

667 文章

467655 浏览

24小时热文