1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

阿里发布名为WebDancer的信息检索Agent,能够像人类一样上网搜索和推理。它在GAIA和WebWalkerQA基准测试中分别取得61.1%和54.6%的Pass@3分数,表现优于基线模型和部分开源框架。模型与方法已开源。

WebDancer通过四阶段训练范式实现自主信息搜索能力:浏览数据构建、轨迹采样、有监督微调和强化学习。其中,轨迹采样基于ReAct框架,采用双路径生成短思维链和长思维链,确保高质量执行轨迹。SFT阶段通过损失函数优化模型任务分解与工具调用能力,RL阶段则使用DAPO算法提升泛化能力。

测试结果显示,WebDancer在GAIA和WebWalkerQA上分别达到46.6%和43.2%的准确率,优于无代理能力的框架。在BrowseComp和BrowseComp-zh等挑战性数据集上也表现出色。其奖励机制结合格式奖励和答案奖励,权重分别为0.1和0.9。相关论文、代码和模型已公开。

原文链接
本文链接:https://kx.umi6.com/article/20845.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
阿里加速“抢人”:开放数百个招聘岗位,九成与AI相关
2025-02-19 13:51:10
通义赶「末班车」
2024-12-25 19:11:42
百度、阿里、字节,在AI手机里握手言和
2024-07-30 12:56:39
阿里自研“深度思考”推理模型已上线夸克 AI 搜索,后续将有更强模型上线
2025-03-01 15:00:52
阿里将推出基于 Qwen2.5-MAX 的深度推理模型
2025-02-20 21:26:21
净利润大增333%,阿里转身
2025-02-21 15:50:13
阿里否认以百亿美元估值认购DeepSeek10%股权
2025-02-07 22:07:23
「马云回归」与AI,是阿里下一阶段的关键词?
2025-05-12 11:31:24
阿里正式推出AI旗舰应用 新夸克发布“AI超级框”
2025-03-13 12:15:10
全球顶级AI科学家许主洪加盟阿里!IEEE Fellow,五万被引论文数,曾任Salesforce集团副总裁
2025-02-08 14:22:14
AI To C,阿里亮出明牌
2025-01-17 11:13:48
消息指苹果抛弃DeepSeek,选择与阿里合作开发中国iPhone AI 功能
2025-02-12 00:10:01
阿里开源长文本深度思考模型!渐进式强化学习破解长文本训练难题
2025-05-27 15:55:36
24小时热文
更多
扫一扫体验小程序