1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

开源Agent模型榜第一名,现在是阿里通义DeepResearch

阿里开源了其首个深度研究Agent模型——通义DeepResearch。这款30B-A3B轻量级模型在HLE、BrowseComp-zh、GAIA等多个权威评测集中表现优异,超越了OpenAI Deep Research、DeepSeek-V3.1等知名模型,成为开源Agent领域的佼佼者。

核心亮点

通义DeepResearch的优势在于其创新的数据策略和训练方法。团队设计了一套多阶段数据生成方案,无需昂贵的人工标注即可大规模生成高质量训练数据。通过“增量预训练”和“后训练”两个阶段,模型在复杂任务中表现出色。

  • 增量预训练:基于知识文档、爬虫数据和工具调用结果,构建开放世界知识记忆,并生成多风格问答对。
  • 后训练:开发全自动数据生成方案(如WebSailor、WebShaper),通过模糊问题信息提升难度,并采用集合论建模确保问题质量。

推理模式

模型支持两种推理模式: - ReAct Mode:遵循“思考-行动-观察”循环,适合通用任务。 - Heavy Mode:基于IterResearch范式,将复杂任务分解为多轮研究,避免认知瓶颈。

此外,团队还提出了Research-Synthesis框架,让多个Agent并行探索问题并整合报告,进一步提升答案准确性。

训练与优化

通义DeepResearch采用了Agentic CPT→SFT→RL的全链路训练范式。强化学习阶段基于GRPO算法优化,结合token级别策略梯度损失函数和留一法降低方差。团队强调,数据质量和训练环境稳定性是成功的关键。

应用场景

目前,通义DeepResearch已赋能多个阿里巴巴内部应用: - 高德出行Agent:提升复杂查询体验,助力地图导航与本地生活服务。 - 通义法睿:法律智能体,提供法律问答、案例检索、合同审查等功能,在司法领域表现卓越。

开源资源

通义DeepResearch的模型、框架和代码已全面开源,感兴趣的朋友可通过以下链接获取: - 项目主页: https://tongyi-agent.github.io/
- 博客: https://tongyi-agent.github.io/blog/introducing-tongyi-deep-research/
- Github地址: https://github.com/Alibaba-NLP/DeepResearch
- Hugging Face地址: https://huggingface.co/Alibaba-NLP/Tongyi-DeepResearch-30B-A3B
- Model Scope: https://modelscope.cn/models/iic/Tongyi-DeepResearch-30B-A3B

通义DeepResearch以创新的技术和开放的姿态,为AI Agent的研究与应用树立了新标杆。

原文链接
本文链接:https://kx.umi6.com/article/25452.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
三家混战,大模型重回2023
2025-08-03 11:35:50
刚刚,马斯克开源Grok 2.5:中国公司才是xAI最大对手
2025-08-24 10:10:55
鹅厂开源视频生成大杀器!参考图主体精准复刻,还能编辑现有视频
2025-05-09 21:57:02
DeepSeek开源新版R1 媲美OpenAI最高o3模型
2025-05-29 05:51:14
谷歌太壕了!编程Agent大招至简:开源且免费,百万上下文、多模态、MCP全支持
2025-06-26 10:56:45
全球首款AI 多人游戏来了,你的老电脑也能玩
2025-05-09 18:56:07
Transformer作者:DeepSeek才有搞头,OpenAI指望不上了
2025-09-12 11:09:05
月之暗面 Kimi K2 发布并开源,擅长代码与 Agentic 任务
2025-07-11 23:44:58
小扎自曝挖人秘诀:小团队我亲自带,豪掷数百亿建GW集群,大家不图天价薪酬只为“造神”
2025-07-15 13:42:34
GOSIM AI Paris 2025圆满收官!80+位全球大咖共探模型前沿、算力挑战与落地路径
2025-05-21 09:58:44
上传一张图、主演任何视频,“性能最强动作生成模型”阿里通义万相 Wan2.2-Animate 开源
2025-09-19 15:14:57
外滩大会今年太AI了!王坚暴论:OpenAI确实站在了历史错误的一边
2025-09-12 12:10:41
业界首个,腾讯混元 3D 世界模型正式发布并开源
2025-07-27 11:55:13
24小时热文
更多
扫一扫体验小程序