综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
1月8日,阿里通义正式发布并开源Qwen3-VL-Embedding和Qwen3-VL-Reranker模型系列。两款模型基于Qwen3-VL构建,专为多模态信息检索与跨模态理解设计,支持文本、图像、视频等多模态输入,在图文检索、视频匹配、视觉问答等任务中表现优异。Qwen3-VL-Embedding通过统一表示学习生成语义向量,实现高效跨模态检索;Qwen3-VL-Reranker则优化重排序,输出精确相关性分数,二者协同构成“两阶段检索流程”。该系列支持超30种语言,性能在MMEB-v2、MMTEB等权威基准测试中领先业界,适合全球化部署。模型已开源,可通过GitHub和魔搭ModelScope获取。
原文链接
标题:快手与东北大学联合推出UNITE框架,突破多模态检索瓶颈
多模态检索作为信息获取的关键技术,长期受制于跨模态干扰问题。为此,快手与东北大学的研究团队共同开发了多模态统一嵌入框架——UNITE。该框架旨在构建一个能够同时处理文本、图像、视频及其融合模态输入的统一嵌入器。
UNITE通过对比学...
原文链接
标题:仅1/70数据量,多模态检索效果更优!智源发布BGE-VL,合成数据立大功
BGE系列模型自发布以来广受好评。近日,智源研究院联合多所高校开发了多模态向量模型BGE-VL,进一步扩展了原有生态体系。BGE-VL在图文检索、组合图像检索等主要多模态检索任务中表现最佳,借助大规模合成数据MegaP...
原文链接
标题:阿里多模态检索智能体,自带O1式思考过程!复杂问题逐步拆解
阿里通义实验室推出名为OmniSearch的多模态检索智能体,能模拟人类解决问题的思维方式,将复杂问题逐步拆解进行智能检索规划。
上传图片并提问,OmniSearch会模拟“思考过程”,不仅拆解复杂问题,还会根据当前检索结果和问题情境...
原文链接
加载更多
暂无内容