标题:仅1/70数据量,多模态检索效果更优!智源发布BGE-VL,合成数据立大功
BGE系列模型自发布以来广受好评。近日,智源研究院联合多所高校开发了多模态向量模型BGE-VL,进一步扩展了原有生态体系。BGE-VL在图文检索、组合图像检索等主要多模态检索任务中表现最佳,借助大规模合成数据MegaPairs训练。
MegaPairs具有两大核心优势: - 优异的可扩展性:高效挖掘多模态三元组数据,以低成本生成多样化且高质量的多模态三元组,此次发布的版本包含2600万条样本。 - 卓越的数据质量:仅需1/70的数据量即可实现更优的训练效果,显著提升多模态检索模型的性能。
BGE-VL的技术报告已发布,相关数据、模型及代码资源将向社区开放。
MegaPairs通过挖掘图像数据集中的多样图像对,利用开源模型生成高质量的多模态检索指令,构建出大规模、高质量的多模态检索指令数据集。基于MegaPairs数据,智源BGE团队训练了多款多模态检索模型,显著提升性能。
在MMEB基准测试中,BGE-VL在多项任务上实现了最优性能,甚至在未包含相关任务数据的情况下仍能泛化良好。在CIRCO评测集上,BGE-VL刷新了现有基准,大幅超越谷歌和英伟达的对比模型。
未来,智源将继续探索MegaPairs与更多多模态检索场景结合,打造更全能的多模态检索器。更多详情请参考论文。
原文链接
本文链接:https://kx.umi6.com/article/14998.html
转载请注明文章出处
相关推荐
.png)
换一换
仅1/70的数据量,多模态检索效果却更优! 智源发布BGE-VL,合成数据立大功
2025-03-07 15:55:37
阿里多模态检索智能体,自带o1式思考过程!复杂问题逐步拆解
2024-12-04 14:39:11
打破跨模态干扰,快手东北大学联合提出统一多模态框架,横扫多模态检索基准
2025-06-09 18:30:52
英伟达砸15亿美元 从Lambda租用搭载自家芯片的GPU服务器
2025-09-05 15:26:12
阿里通义千问发布迄今最大模型——Qwen3-Max-Preview
2025-09-06 00:27:49
AI版Siri虽迟但到?苹果或联手谷歌Gemini 升级iPhone搜索功能
2025-09-04 12:01:25
中信建投:计算机板块上半年业绩持续改善 看好AI软件&硬件、信创等板块投资机会
2025-09-05 09:17:05
李飞飞的答案:大模型之后,Agent向何处去?
2025-09-05 09:13:59
支持百万卡扩展,中科曙光发布国内首个开放架构 AI 超集群系统
2025-09-05 21:25:03
摩尔线程及中介机构回复首轮审核问询函
2025-09-05 20:24:47
100倍AI推理能效提升,“模拟光学计算机”来了
2025-09-04 15:08:12
AI 的下一个战场:小模型崛起
2025-09-05 21:26:34
港科广×腾讯联手打造《我的世界》神操作,400张截图就能让AI挖矿通关,成本降至5%|EMNLP 2025
2025-09-04 19:05:34
486 文章
156740 浏览
24小时热文
更多

-
2025-09-06 08:33:16
-
2025-09-06 08:32:00
-
2025-09-06 06:30:37