5月9日,阿里巴巴开源了ZeroSearch大模型,该模型无需依赖外部搜索引擎即可具备搜索能力。ZeroSearch是一种强化学习框架,通过生成相关文档响应查询,利用课程化展开机制逐步提升模型推理能力。实验表明,ZeroSearch在多个数据集上的表现优于基于真实搜索引擎的模型,70亿参数模型在7大问答数据集上的成绩超越谷歌搜索(得分33.06 vs. 谷歌32.47),同时成本降低了87.93%。使用谷歌搜索训练的成本约为586.70美元,而ZeroSearch仅需70.80美元。该模型已在Qwen-2.5、LLaMA-3.2等主流模型中验证,全部代码、数据集及预训练模型已开源至GitHub和Hugging Face。
原文链接
本文链接:https://kx.umi6.com/article/18397.html
转载请注明文章出处
相关推荐
.png)
换一换
通义实验室新研究:大模型自己「扮演」搜索引擎,提升推理能力无需搜索API
2025-05-17 13:07:29
阿里开源千问3向量模型
2025-06-06 11:31:45
阿里开源 Qwen3 新模型 Embedding 及 Reranker,带来强大多语言、跨语言支持
2025-06-06 09:22:06
阿里开源视频生成模型Wan2.2-S2V
2025-08-26 22:55:59
阿里开源通义新模型:指定首尾图片生成视频
2025-04-18 12:13:31
阿里开源 ZeroSearch 模型:可“自学”搜索能力,无需外部搜索引擎
2025-05-09 21:58:06
阿里开源版Sora上线即屠榜,4070就能跑,免费商用
2025-02-26 16:37:10
商汤日日新为 Claude API 用户提供“搬家”服务:可获 5000 万 Tokens 体验包
2025-09-06 15:35:37
硅谷版的“莞莞类卿”?分析师称博通业绩增速令人想起早年的英伟达
2025-09-06 15:35:56
对话阿里巴巴国际站张阔:几分钟完成几周的工作,AI如何改写跨境贸易
2025-09-06 08:32:00
报道称DeepSeek计划年底前发布AI智能体 公司暂无回应
2025-09-04 17:05:24
还得继续砸钱,OpenAI 预计到 2029 年总支出或超千亿美元
2025-09-06 20:38:03
估值翻倍用时约 15 个月:法 AI 企业 Mistral 新融资轮中估值达 120 亿欧元
2025-09-05 12:18:29
493 文章
184371 浏览
24小时热文
更多

-
2025-09-06 20:38:03
-
2025-09-06 19:37:51
-
2025-09-06 16:37:17