
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
通义实验室提出新研究:大模型“扮演”搜索引擎提升推理能力,无需依赖搜索API。传统强化学习结合真实搜索引擎虽能增强大模型检索-推理能力,但面临搜索文档质量不稳定及API高频调用导致成本高昂的问题。为此,通义实验室开源ZeroSearch,无需与真实搜索引擎交互,仅用3B参数的LLM即可显著提升搜索能...
原文链接
5月9日,阿里巴巴开源了ZeroSearch大模型,该模型无需依赖外部搜索引擎即可具备搜索能力。ZeroSearch是一种强化学习框架,通过生成相关文档响应查询,利用课程化展开机制逐步提升模型推理能力。实验表明,ZeroSearch在多个数据集上的表现优于基于真实搜索引擎的模型,70亿参数模型在7大问答数据集上的成绩超越谷歌搜索(得分33.06 vs. 谷歌32.47),同时成本降低了87.93%。使用谷歌搜索训练的成本约为586.70美元,而ZeroSearch仅需70.80美元。该模型已在Qwen-2.5、LLaMA-3.2等主流模型中验证,全部代码、数据集及预训练模型已开源至GitHub和Hugging Face。
原文链接
加载更多

暂无内容