7月7日,阿里云宣布开源网络智能体WebSailor,该模型具备强大推理与检索能力,在BrowseComp评测集中登顶开源网络智能体榜单。WebSailor可快速处理复杂场景中的模糊问题,通过多步推理和交叉验证得出精准答案。通义实验室采用创新post-training方法提升性能,其表现超越DeepSeek R1、Grok-3等闭源模型,仅次于OpenAI DeepResearch。实测显示,WebSailor在高难度及普通任务数据集上均领先,展现极强泛化能力。阿里云表示,其方法可推广至其他领域,如开放领域复杂问答、学术知识发现等。目前,WebSailor的构建方案与部分数据已在Github开源。
原文链接
本文链接:https://kx.umi6.com/article/21313.html
转载请注明文章出处
相关推荐
.png)
换一换
刷新复杂Agent推理记录!阿里通义开源网络智能体超越DeepSeek R1,Grok-3
2025-07-07 17:32:00
OpenAI开源BrowseComp 重塑Agent浏览器评测
2025-04-11 08:38:16
阿里通义开源网络智能体 WebSailor,登顶开源网络智能体榜单
2025-07-07 17:38:21
427 文章
61098 浏览
24小时热文
更多

-
2025-07-20 09:01:50
-
2025-07-20 08:01:35
-
2025-07-19 22:57:32