多模态检索 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

多模态检索新标杆，阿里通义发布并开源 Qwen3-VL-Embedding&Reranker 模型

1月8日，阿里通义正式发布并开源Qwen3-VL-Embedding和Qwen3-VL-Reranker模型系列。两款模型基于Qwen3-VL构建，专为多模态信息检索与跨模态理解设计，支持文本、图像、视频等多模态输入，在图文检索、视频匹配、视觉问答等任务中表现优异。Qwen3-VL-Embedding通过统一表示学习生成语义向量，实现高效跨模态检索；Qwen3-VL-Reranker则优化重排序，输出精确相关性分数，二者协同构成“两阶段检索流程”。该系列支持超30种语言，性能在MMEB-v2、MMTEB等权威基准测试中领先业界，适合全球化部署。模型已开源，可通过GitHub和魔搭ModelScope获取。

原文链接

心智奇点

01-08 23:37:36

Qwen3-VL-Embedding

Qwen3-VL-Reranker

多模态检索

分享至

打开微信扫一扫

内容投诉

生成图片

打破跨模态干扰，快手东北大学联合提出统一多模态框架，横扫多模态检索基准

标题：快手与东北大学联合推出UNITE框架，突破多模态检索瓶颈多模态检索作为信息获取的关键技术，长期受制于跨模态干扰问题。为此，快手与东北大学的研究团队共同开发了多模态统一嵌入框架——UNITE。该框架旨在构建一个能够同时处理文本、图像、视频及其融合模态输入的统一嵌入器。 UNITE通过对比学...

原文链接

代码编织者Nexus

06-09 18:30:52

UNITE

多模态检索

跨模态干扰

分享至

打开微信扫一扫

内容投诉

生成图片

仅1/70的数据量，多模态检索效果却更优! 智源发布BGE-VL，合成数据立大功

标题：仅1/70数据量，多模态检索效果更优！智源发布BGE-VL，合成数据立大功 BGE系列模型自发布以来广受好评。近日，智源研究院联合多所高校开发了多模态向量模型BGE-VL，进一步扩展了原有生态体系。BGE-VL在图文检索、组合图像检索等主要多模态检索任务中表现最佳，借助大规模合成数据MegaP...

原文链接

镜像现实MirageX

03-07 15:55:37

BGE-VL

MegaPairs

多模态检索

分享至

打开微信扫一扫

内容投诉

生成图片

阿里多模态检索智能体，自带o1式思考过程！复杂问题逐步拆解

标题：阿里多模态检索智能体，自带O1式思考过程！复杂问题逐步拆解阿里通义实验室推出名为OmniSearch的多模态检索智能体，能模拟人类解决问题的思维方式，将复杂问题逐步拆解进行智能检索规划。上传图片并提问，OmniSearch会模拟“思考过程”，不仅拆解复杂问题，还会根据当前检索结果和问题情境...

原文链接