检索 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

多模态检索新标杆，阿里通义发布并开源 Qwen3-VL-Embedding&Reranker 模型

1月8日，阿里通义正式发布并开源Qwen3-VL-Embedding和Qwen3-VL-Reranker模型系列。两款模型基于Qwen3-VL构建，专为多模态信息检索与跨模态理解设计，支持文本、图像、视频等多模态输入，在图文检索、视频匹配、视觉问答等任务中表现优异。Qwen3-VL-Embedding通过统一表示学习生成语义向量，实现高效跨模态检索；Qwen3-VL-Reranker则优化重排序，输出精确相关性分数，二者协同构成“两阶段检索流程”。该系列支持超30种语言，性能在MMEB-v2、MMTEB等权威基准测试中领先业界，适合全球化部署。模型已开源，可通过GitHub和魔搭ModelScope获取。

原文链接

心智奇点

01-08 23:37:36

Qwen3-VL-Embedding

Qwen3-VL-Reranker

多模态检索

分享至

打开微信扫一扫

内容投诉

生成图片

让大模型学会“高维找茬”，中国联通新研究解决长文本图像检索痛点｜AAAI 2026 Oral

正文：2025年12月，中国联通数据科学与人工智能研究院在AAAI 2026 (Oral)发表新研究HiMo-CLIP，突破长文本图像检索难题。该模型通过建模“语义层级”与“语义单调性”，自动捕捉语境中的“语义差异点”，显著提升长文本和组合性文本的检索精度，同时兼顾短文本性能。HiMo-CLIP采用层级分解模块（HiDe）和单调性感知对比损失（MoLo），动态提取关键特征并优化图文对齐机制。实验显示，仅用1M训练数据，HiMo-CLIP性能超越使用100M甚至10B数据的现有方法，并在自建数据集HiMo-Docci上取得SOTA结果。

原文链接

Nebula

12-01 17:18:28

HiMo-CLIP

语义层级

长文本图像检索

分享至

打开微信扫一扫

内容投诉

生成图片

用155万模拟视频给模型上课！GVE模型一次学会9种视频检索技能

标题：GVE模型：一次学会9种视频检索技能正文：当前视频检索研究陷入瓶颈，主流模型在经典基准（如MSRVTT）上表现优异，但难以应对真实场景中的复杂需求，例如细粒度语义、长上下文或多模态组合查询。为突破这一局限，香港科技大学（广州）与阿里巴巴通义实验室联合提出通用视频检索（Universal...

原文链接

虚拟织梦者

11-14 16:03:30

GVE模型

多模态训练

通用视频检索

分享至

打开微信扫一扫

内容投诉

生成图片

自然语言简化查找专利流程，Perplexity 推出新版 AI 检索工具

10月31日，科技媒体The Verge报道，Perplexity推出新版AI检索工具，支持自然语言搜索专利。用户可直接提问如“有关AI语言学习的专利吗？”或“2024年后量子计算的重要专利？”，系统会返回专利结果并附带AI生成摘要。相比传统关键词搜索，新工具准确性更高，例如搜索“健身追踪器”时，还能关联“计步器”、“健康检测手表”等语义相关专利，并扩展至学术论文和公开软件仓库等领域。目前功能处于公测阶段，所有用户可免费体验，Pro和Max订阅用户享有更高配额及定制功能。

原文链接

Oasis

10-31 23:56:43

Perplexity

专利检索

自然语言

分享至

打开微信扫一扫

内容投诉

生成图片

让RAG真正读懂“言外之意”！新框架引入词汇多样性，刷新多项基准SOTA

ACL 2025最新研究提出Lexical Diversity-aware RAG（DRAG）框架，首次将词汇多样性引入RAG的检索与生成过程，在多项基准任务中显著提升性能。该框架通过Diversity-sensitive Relevance Analyzer（DRA）和Risk-guided Sparse Calibration（RSC）两大模块，解决了词汇多样性带来的检索偏差和生成干扰问题。在HotpotQA等多跳问答任务中，准确率提升10.6%，刷新SOTA；在ASQA长答案生成任务中表现同样优异。此方法对信息检索、问答系统及专业领域大模型应用具有重要价值，代码即将开源。

原文链接

Oasis

09-27 13:43:19

RAG

检索增强生成

词汇多样性

分享至

打开微信扫一扫

内容投诉

生成图片

腾讯宣布开源 Youtu-GraphRAG 框架，解决图检索增强技术难题

正文：9月13日，腾讯优图实验室宣布开源Youtu-GraphRAG框架，旨在解决图检索增强生成（GraphRAG）技术的难题。该框架在六个跨领域多语言基准测试中表现优异，具备三大优势：构图成本节省30%以上、复杂推理任务准确率提升16%+、支持中英双语及跨领域无缝迁移。Youtu-GraphRAG通过Schema连接智能体，实现图构建、索引与检索的垂直统一，并采用四层架构设计（属性层、关系层、关键词层、社区层）优化知识抽取与推理能力。此外，其社区检测算法融合结构与语义信息，显著优于传统方法。框架已开源，论文同步发布。

原文链接

数码游侠

09-13 10:24:35

Youtu-GraphRAG

图检索增强生成

开源框架

分享至

打开微信扫一扫

内容投诉

生成图片

阿里发布信息检索Agent，可自主上网查资料，GAIA基准超越GPT-4o | 模型&数据开源

阿里发布名为WebDancer的信息检索Agent，能够像人类一样上网搜索和推理。它在GAIA和WebWalkerQA基准测试中分别取得61.1%和54.6%的Pass@3分数，表现优于基线模型和部分开源框架。模型与方法已开源。 WebDancer通过四阶段训练范式实现自主信息搜索能力：浏览数据构建...

原文链接

跨界思维

06-27 14:08:29

GAIA基准

信息检索Agent

阿里

分享至

打开微信扫一扫

内容投诉

生成图片

只改2行代码，RAG效率暴涨30%！可扩展至百亿级数据规模应用

标题：只改2行代码，RAG效率暴涨30%！可扩展至百亿级数据规模应用只需修改两行代码，RAG向量检索效率提升30%，适用于文搜文、图搜图、文搜图及推荐系统召回等多种任务，且具备十亿至百亿级数据的扩展能力。浙江大学高云君、柯翔宇团队与向量检索专家傅聪合作，开源新方法PSP（Proximity g...

原文链接

AI创想团

06-21 15:10:22

PSP

RAG

向量检索

分享至

打开微信扫一扫

内容投诉

生成图片

打破跨模态干扰，快手东北大学联合提出统一多模态框架，横扫多模态检索基准

标题：快手与东北大学联合推出UNITE框架，突破多模态检索瓶颈多模态检索作为信息获取的关键技术，长期受制于跨模态干扰问题。为此，快手与东北大学的研究团队共同开发了多模态统一嵌入框架——UNITE。该框架旨在构建一个能够同时处理文本、图像、视频及其融合模态输入的统一嵌入器。 UNITE通过对比学...

原文链接

代码编织者Nexus

06-09 18:30:52

UNITE

多模态检索

跨模态干扰

分享至

打开微信扫一扫

内容投诉

生成图片

大模型集体“挂科”！全新中文网页检索测试：GPT-4o准确率仅6.2%

标题：大模型集体“挂科”！全新中文网页检索测试：GPT-4o准确率仅6.2% 你以为大模型已经能轻松“上网冲浪”了？全新基准测试集BrowseComp-ZH直接打脸主流AI。这项由港科大（广州）、北大、浙大、阿里、字节跳动、NIO等机构联合发布的测试集，让20多个中外主流大模型集体“挂科”。其中，G...

原文链接