阿里发布名为WebDancer的信息检索Agent,能够像人类一样上网搜索和推理。它在GAIA和WebWalkerQA基准测试中分别取得61.1%和54.6%的Pass@3分数,表现优于基线模型和部分开源框架。模型与方法已开源。
WebDancer通过四阶段训练范式实现自主信息搜索能力:浏览数据构建、轨迹采样、有监督微调和强化学习。其中,轨迹采样基于ReAct框架,采用双路径生成短思维链和长思维链,确保高质量执行轨迹。SFT阶段通过损失函数优化模型任务分解与工具调用能力,RL阶段则使用DAPO算法提升泛化能力。
测试结果显示,WebDancer在GAIA和WebWalkerQA上分别达到46.6%和43.2%的准确率,优于无代理能力的框架。在BrowseComp和BrowseComp-zh等挑战性数据集上也表现出色。其奖励机制结合格式奖励和答案奖励,权重分别为0.1和0.9。相关论文、代码和模型已公开。
原文链接
本文链接:https://kx.umi6.com/article/20845.html
转载请注明文章出处
相关推荐
换一换
阿里云拿下高奢品牌 LV 母公司五年长期合约,整合通义千问 AI 技术
2024-05-23 15:50:46
阿里正式推出AI旗舰应用 新夸克发布“AI超级框”
2025-03-13 12:15:10
阿里CEO吴泳铭内网发帖:回归初心 重新创业
2025-05-09 09:50:05
阿里 Qwen Chat 平台上线“深度思考”功能:基于 QwQ-Max-Preview 推理模型,支持联网搜索
2025-02-25 11:54:04
苹果AI为什么选择了阿里
2025-02-14 10:30:19
阿里将推出基于 Qwen2.5-MAX 的深度推理模型
2025-02-20 21:26:21
DeepSeek或考虑以数十亿美金估值进行融资,阿里股价随即涨超6%
2025-02-07 20:04:07
阿里发布全球最强开源模型千问3,通义App第一时间开启体验
2025-04-30 18:48:34
净利润大增333%,阿里转身
2025-02-21 15:50:13
阿里回应10亿美元投资DeepSeek:假消息!
2025-02-07 20:11:32
阿里发布 AI 编程工具 Qoder:集成“全球顶尖”模型,限时免费
2025-08-22 10:47:51
消息称字节跳动 8 位数年薪挖走阿里通义千问技术负责人周畅,十多个人跟着跳槽
2024-12-06 14:28:52
马云再次现身引热议!DeepSeek爆火,阿里巴巴能否借势AI?
2025-02-11 23:08:37
664 文章
498080 浏览
24小时热文
更多
-
2026-03-10 09:02:22 -
2026-03-10 09:01:12 -
2026-03-10 09:00:02