综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
正文:2025年12月,中国联通数据科学与人工智能研究院在AAAI 2026 (Oral)发表新研究HiMo-CLIP,突破长文本图像检索难题。该模型通过建模“语义层级”与“语义单调性”,自动捕捉语境中的“语义差异点”,显著提升长文本和组合性文本的检索精度,同时兼顾短文本性能。HiMo-CLIP采用层级分解模块(HiDe)和单调性感知对比损失(MoLo),动态提取关键特征并优化图文对齐机制。实验显示,仅用1M训练数据,HiMo-CLIP性能超越使用100M甚至10B数据的现有方法,并在自建数据集HiMo-Docci上取得SOTA结果。
原文链接
标题:GVE模型:一次学会9种视频检索技能
正文:
当前视频检索研究陷入瓶颈,主流模型在经典基准(如MSRVTT)上表现优异,但难以应对真实场景中的复杂需求,例如细粒度语义、长上下文或多模态组合查询。为突破这一局限,香港科技大学(广州)与阿里巴巴通义实验室联合提出通用视频检索(Universal...
原文链接
10月31日,科技媒体The Verge报道,Perplexity推出新版AI检索工具,支持自然语言搜索专利。用户可直接提问如“有关AI语言学习的专利吗?”或“2024年后量子计算的重要专利?”,系统会返回专利结果并附带AI生成摘要。相比传统关键词搜索,新工具准确性更高,例如搜索“健身追踪器”时,还能关联“计步器”、“健康检测手表”等语义相关专利,并扩展至学术论文和公开软件仓库等领域。目前功能处于公测阶段,所有用户可免费体验,Pro和Max订阅用户享有更高配额及定制功能。
原文链接
ACL 2025最新研究提出Lexical Diversity-aware RAG(DRAG)框架,首次将词汇多样性引入RAG的检索与生成过程,在多项基准任务中显著提升性能。该框架通过Diversity-sensitive Relevance Analyzer(DRA)和Risk-guided Sparse Calibration(RSC)两大模块,解决了词汇多样性带来的检索偏差和生成干扰问题。在HotpotQA等多跳问答任务中,准确率提升10.6%,刷新SOTA;在ASQA长答案生成任务中表现同样优异。此方法对信息检索、问答系统及专业领域大模型应用具有重要价值,代码即将开源。
原文链接
正文:9月13日,腾讯优图实验室宣布开源Youtu-GraphRAG框架,旨在解决图检索增强生成(GraphRAG)技术的难题。该框架在六个跨领域多语言基准测试中表现优异,具备三大优势:构图成本节省30%以上、复杂推理任务准确率提升16%+、支持中英双语及跨领域无缝迁移。Youtu-GraphRAG通过Schema连接智能体,实现图构建、索引与检索的垂直统一,并采用四层架构设计(属性层、关系层、关键词层、社区层)优化知识抽取与推理能力。此外,其社区检测算法融合结构与语义信息,显著优于传统方法。框架已开源,论文同步发布。
原文链接
阿里发布名为WebDancer的信息检索Agent,能够像人类一样上网搜索和推理。它在GAIA和WebWalkerQA基准测试中分别取得61.1%和54.6%的Pass@3分数,表现优于基线模型和部分开源框架。模型与方法已开源。
WebDancer通过四阶段训练范式实现自主信息搜索能力:浏览数据构建...
原文链接
标题:只改2行代码,RAG效率暴涨30%!可扩展至百亿级数据规模应用
只需修改两行代码,RAG向量检索效率提升30%,适用于文搜文、图搜图、文搜图及推荐系统召回等多种任务,且具备十亿至百亿级数据的扩展能力。浙江大学高云君、柯翔宇团队与向量检索专家傅聪合作,开源新方法PSP(Proximity g...
原文链接
标题:快手与东北大学联合推出UNITE框架,突破多模态检索瓶颈
多模态检索作为信息获取的关键技术,长期受制于跨模态干扰问题。为此,快手与东北大学的研究团队共同开发了多模态统一嵌入框架——UNITE。该框架旨在构建一个能够同时处理文本、图像、视频及其融合模态输入的统一嵌入器。
UNITE通过对比学...
原文链接
标题:大模型集体“挂科”!全新中文网页检索测试:GPT-4o准确率仅6.2%
你以为大模型已经能轻松“上网冲浪”了?全新基准测试集BrowseComp-ZH直接打脸主流AI。这项由港科大(广州)、北大、浙大、阿里、字节跳动、NIO等机构联合发布的测试集,让20多个中外主流大模型集体“挂科”。其中,G...
原文链接
标题:仅1/70数据量,多模态检索效果更优!智源发布BGE-VL,合成数据立大功
BGE系列模型自发布以来广受好评。近日,智源研究院联合多所高校开发了多模态向量模型BGE-VL,进一步扩展了原有生态体系。BGE-VL在图文检索、组合图像检索等主要多模态检索任务中表现最佳,借助大规模合成数据MegaP...
原文链接
加载更多
暂无内容