1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:只改2行代码,RAG效率暴涨30%!可扩展至百亿级数据规模应用

只需修改两行代码,RAG向量检索效率提升30%,适用于文搜文、图搜图、文搜图及推荐系统召回等多种任务,且具备十亿至百亿级数据的扩展能力。浙江大学高云君、柯翔宇团队与向量检索专家傅聪合作,开源新方法PSP(Proximity graph with Spherical Pathway),解决RAG两大难题。

主流向量检索基于欧几里得距离,而PSP发现,通过微调,旧图结构也能找到最大内积最优解。此外,PSP引入提前停止策略,避免无谓计算,加速搜索。

向量检索是AI产品的核心技术,但传统算法多为欧式空间设计,“度量错配”常导致检索结果与语义无关。最大内积检索领域缺乏HNSW、NSG这样的顶级算法,其效果常受数据集限制。

PSP团队通过理论研究,证明在现有欧式图索引结构上,通过调整两行代码即可实现最大内积检索的全局最优解。同时,PSP优化搜索行为,减少冗余计算,设计自适应停止策略,显著提高效率。

实验显示,PSP在多个高维大数据集上性能稳定,相比现有算法提升明显,尤其在MNIST数据集上高出4倍。PSP支持多种数据模态,具备优异的泛化性和log(N)级别的可扩展性,适合百亿级数据检索。

论文链接: https://arxiv.org/pdf/2503.06882
GitHub链接: https://github.com/ZJU-DAILY/PSP

原文链接
本文链接:https://kx.umi6.com/article/20588.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
没有RAG打底,一切都是PPT,RAG作者Douwe Kiela的10个关键教训
2025-07-01 12:22:59
只是RAG了一下,我看到了AI大模型的态度!
2025-01-27 14:29:34
只改2行代码,RAG效率暴涨30%!可扩展至百亿级数据规模应用
2025-06-21 15:10:22
24小时热文
更多
扫一扫体验小程序