7月7日,阿里云宣布开源网络智能体WebSailor,该模型具备强大推理与检索能力,在BrowseComp评测集中登顶开源网络智能体榜单。WebSailor可快速处理复杂场景中的模糊问题,通过多步推理和交叉验证得出精准答案。通义实验室采用创新post-training方法提升性能,其表现超越DeepSeek R1、Grok-3等闭源模型,仅次于OpenAI DeepResearch。实测显示,WebSailor在高难度及普通任务数据集上均领先,展现极强泛化能力。阿里云表示,其方法可推广至其他领域,如开放领域复杂问答、学术知识发现等。目前,WebSailor的构建方案与部分数据已在Github开源。
原文链接
本文链接:https://kx.umi6.com/article/21313.html
转载请注明文章出处
相关推荐
.png)
换一换
OpenAI开源BrowseComp 重塑Agent浏览器评测
2025-04-11 08:38:16
刷新复杂Agent推理记录!阿里通义开源网络智能体超越DeepSeek R1,Grok-3
2025-07-07 17:32:00
阿里通义开源网络智能体 WebSailor,登顶开源网络智能体榜单
2025-07-07 17:38:21
OpenAI秘密项目曝光:进军投行业务
2025-10-22 16:49:15
独家|阿里夸克“C计划”揭晓 上线对话助手 把“豆包”塞了进去
2025-10-23 10:05:55
马斯克:特斯拉正在努力“超额生产”AI5芯片
2025-10-23 09:00:35
超800名科技领袖联合呼吁:停止研发超级智能 可能导致人类灭绝
2025-10-23 00:54:02
比超级计算机快1.3万倍!谷歌量子计算再现突破 诺奖得主送上关键助攻
2025-10-23 11:03:01
智谱运气是差一点点,视觉Token研究又和DeepSeek撞车了
2025-10-23 15:07:10
字节跳动 Seed3D 1.0 发布:一张图就能生成高精度 3D 模型
2025-10-23 14:05:22
字节跳动推出3D生成大模型
2025-10-23 16:11:27
自动驾驶,走出青春期
2025-10-23 15:09:02
Meta AI大裁600人
2025-10-23 10:02:20
527 文章
240492 浏览
24小时热文
更多

-
2025-10-24 05:23:38
-
2025-10-24 03:21:23
-
2025-10-24 01:20:07