阿里发布名为WebDancer的信息检索Agent,能够像人类一样上网搜索和推理。它在GAIA和WebWalkerQA基准测试中分别取得61.1%和54.6%的Pass@3分数,表现优于基线模型和部分开源框架。模型与方法已开源。
WebDancer通过四阶段训练范式实现自主信息搜索能力:浏览数据构建、轨迹采样、有监督微调和强化学习。其中,轨迹采样基于ReAct框架,采用双路径生成短思维链和长思维链,确保高质量执行轨迹。SFT阶段通过损失函数优化模型任务分解与工具调用能力,RL阶段则使用DAPO算法提升泛化能力。
测试结果显示,WebDancer在GAIA和WebWalkerQA上分别达到46.6%和43.2%的准确率,优于无代理能力的框架。在BrowseComp和BrowseComp-zh等挑战性数据集上也表现出色。其奖励机制结合格式奖励和答案奖励,权重分别为0.1和0.9。相关论文、代码和模型已公开。
原文链接
本文链接:https://kx.umi6.com/article/20845.html
转载请注明文章出处
相关推荐
换一换
阿里CEO吴泳铭:未来三年在云和AI的基础设施投入预计将超越过去十年的总和
2025-02-21 00:31:46
阿里回应10亿美元投资DeepSeek:假消息!
2025-02-07 20:11:32
阿里发布开源推理模型QwQ-32B 支持消费级显卡本地部署
2025-03-06 07:45:41
通义赶「末班车」
2024-12-25 19:11:42
马云再次现身引热议!DeepSeek爆火,阿里巴巴能否借势AI?
2025-02-11 23:08:37
苹果AI为什么选择了阿里
2025-02-14 10:30:19
消息称字节跳动 8 位数年薪挖走阿里通义千问技术负责人周畅,十多个人跟着跳槽
2024-12-06 14:28:52
阿里发布信息检索Agent,可自主上网查资料,GAIA基准超越GPT-4o | 模型&数据开源
2025-06-27 14:08:29
阿里云拿下高奢品牌 LV 母公司五年长期合约,整合通义千问 AI 技术
2024-05-23 15:50:46
阿里全员“AI驱动” 再变阵 产品狂人"钉钉之父"陈航重磅回归 | 深度
2025-04-02 19:41:46
阿里亲身入局具身智能!Qwen内部组团,通义千问技术负责人带队
2025-10-11 09:17:58
百度、阿里、字节,在AI手机里握手言和
2024-07-30 12:56:39
阿里发布 AI 编程工具 Qoder:集成“全球顶尖”模型,限时免费
2025-08-22 10:47:51
519 文章
257161 浏览
24小时热文
更多
-
2025-10-24 09:32:35 -
2025-10-24 09:31:18 -
2025-10-24 09:30:10