1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

7月7日,阿里云宣布开源网络智能体WebSailor,该模型具备强大推理与检索能力,在BrowseComp评测集中登顶开源网络智能体榜单。WebSailor可快速处理复杂场景中的模糊问题,通过多步推理和交叉验证得出精准答案。通义实验室采用创新post-training方法提升性能,其表现超越DeepSeek R1、Grok-3等闭源模型,仅次于OpenAI DeepResearch。实测显示,WebSailor在高难度及普通任务数据集上均领先,展现极强泛化能力。阿里云表示,其方法可推广至其他领域,如开放领域复杂问答、学术知识发现等。目前,WebSailor的构建方案与部分数据已在Github开源。

原文链接
本文链接:https://kx.umi6.com/article/21313.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
阿里通义开源网络智能体 WebSailor,登顶开源网络智能体榜单
2025-07-07 17:38:21
OpenAI开源BrowseComp 重塑Agent浏览器评测
2025-04-11 08:38:16
刷新复杂Agent推理记录!阿里通义开源网络智能体超越DeepSeek R1,Grok-3
2025-07-07 17:32:00
趁着HBM热潮加速!SK海力士Q2蝉联全球DRAM市占率第一
2025-09-05 13:22:16
港科广×腾讯联手打造《我的世界》神操作,400张截图就能让AI挖矿通关,成本降至5%|EMNLP 2025
2025-09-04 19:05:34
实测美团 LongCat:快到极致,但是别说追平 DeepSeek
2025-09-05 15:22:48
机构:ChatGPT在印度实现强劲增长 8月下载量达1020万次
2025-09-05 09:15:57
智谱打响中场战事
2025-09-06 06:30:37
OpenAI杀入招聘市场:打造AI技能认证体系+人才对接平台
2025-09-05 06:12:15
商汤日日新为 Claude API 用户提供“搬家”服务:可获 5000 万 Tokens 体验包
2025-09-06 15:35:37
导演宁浩称自己看病先问 DeepSeek,作家余华则用豆包
2025-09-04 20:07:22
手机与 PC 的最后边界,终于被三折叠打破
2025-09-04 19:06:54
OpenAI 不想再「跪着」买显卡了
2025-09-05 18:24:42
24小时热文
更多
扫一扫体验小程序