1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
让大模型学会“高维找茬”,中国联通新研究解决长文本图像检索痛点|AAAI 2026 Oral
正文:2025年12月,中国联通数据科学与人工智能研究院在AAAI 2026 (Oral)发表新研究HiMo-CLIP,突破长文本图像检索难题。该模型通过建模“语义层级”与“语义单调性”,自动捕捉语境中的“语义差异点”,显著提升长文本和组合性文本的检索精度,同时兼顾短文本性能。HiMo-CLIP采用层级分解模块(HiDe)和单调性感知对比损失(MoLo),动态提取关键特征并优化图文对齐机制。实验显示,仅用1M训练数据,HiMo-CLIP性能超越使用100M甚至10B数据的现有方法,并在自建数据集HiMo-Docci上取得SOTA结果。
Nebula
12-01 17:18:28
HiMo-CLIP
语义层级
长文本图像检索
分享至
打开微信扫一扫
内容投诉
生成图片
用155万模拟视频给模型上课!GVE模型一次学会9种视频检索技能
标题:GVE模型:一次学会9种视频检索技能 正文: 当前视频检索研究陷入瓶颈,主流模型在经典基准(如MSRVTT)上表现优异,但难以应对真实场景中的复杂需求,例如细粒度语义、长上下文或多模态组合查询。为突破这一局限,香港科技大学(广州)与阿里巴巴通义实验室联合提出通用视频检索(Universal...
虚拟织梦者
11-14 16:03:30
GVE模型
多模态训练
通用视频检索
分享至
打开微信扫一扫
内容投诉
生成图片
自然语言简化查找专利流程,Perplexity 推出新版 AI 检索工具
10月31日,科技媒体The Verge报道,Perplexity推出新版AI检索工具,支持自然语言搜索专利。用户可直接提问如“有关AI语言学习的专利吗?”或“2024年后量子计算的重要专利?”,系统会返回专利结果并附带AI生成摘要。相比传统关键词搜索,新工具准确性更高,例如搜索“健身追踪器”时,还能关联“计步器”、“健康检测手表”等语义相关专利,并扩展至学术论文和公开软件仓库等领域。目前功能处于公测阶段,所有用户可免费体验,Pro和Max订阅用户享有更高配额及定制功能。
Oasis
10-31 23:56:43
Perplexity
专利检索
自然语言
分享至
打开微信扫一扫
内容投诉
生成图片
让RAG真正读懂“言外之意”!新框架引入词汇多样性,刷新多项基准SOTA
ACL 2025最新研究提出Lexical Diversity-aware RAG(DRAG)框架,首次将词汇多样性引入RAG的检索与生成过程,在多项基准任务中显著提升性能。该框架通过Diversity-sensitive Relevance Analyzer(DRA)和Risk-guided Sparse Calibration(RSC)两大模块,解决了词汇多样性带来的检索偏差和生成干扰问题。在HotpotQA等多跳问答任务中,准确率提升10.6%,刷新SOTA;在ASQA长答案生成任务中表现同样优异。此方法对信息检索、问答系统及专业领域大模型应用具有重要价值,代码即将开源。
Oasis
09-27 13:43:19
RAG
检索增强生成
词汇多样性
分享至
打开微信扫一扫
内容投诉
生成图片
腾讯宣布开源 Youtu-GraphRAG 框架,解决图检索增强技术难题
正文:9月13日,腾讯优图实验室宣布开源Youtu-GraphRAG框架,旨在解决图检索增强生成(GraphRAG)技术的难题。该框架在六个跨领域多语言基准测试中表现优异,具备三大优势:构图成本节省30%以上、复杂推理任务准确率提升16%+、支持中英双语及跨领域无缝迁移。Youtu-GraphRAG通过Schema连接智能体,实现图构建、索引与检索的垂直统一,并采用四层架构设计(属性层、关系层、关键词层、社区层)优化知识抽取与推理能力。此外,其社区检测算法融合结构与语义信息,显著优于传统方法。框架已开源,论文同步发布。
数码游侠
09-13 10:24:35
Youtu-GraphRAG
图检索增强生成
开源框架
分享至
打开微信扫一扫
内容投诉
生成图片
阿里发布信息检索Agent,可自主上网查资料,GAIA基准超越GPT-4o | 模型&数据开源
阿里发布名为WebDancer的信息检索Agent,能够像人类一样上网搜索和推理。它在GAIA和WebWalkerQA基准测试中分别取得61.1%和54.6%的Pass@3分数,表现优于基线模型和部分开源框架。模型与方法已开源。 WebDancer通过四阶段训练范式实现自主信息搜索能力:浏览数据构建...
跨界思维
06-27 14:08:29
GAIA基准
信息检索Agent
阿里
分享至
打开微信扫一扫
内容投诉
生成图片
只改2行代码,RAG效率暴涨30%!可扩展至百亿级数据规模应用
标题:只改2行代码,RAG效率暴涨30%!可扩展至百亿级数据规模应用 只需修改两行代码,RAG向量检索效率提升30%,适用于文搜文、图搜图、文搜图及推荐系统召回等多种任务,且具备十亿至百亿级数据的扩展能力。浙江大学高云君、柯翔宇团队与向量检索专家傅聪合作,开源新方法PSP(Proximity g...
AI创想团
06-21 15:10:22
PSP
RAG
向量检索
分享至
打开微信扫一扫
内容投诉
生成图片
打破跨模态干扰,快手东北大学联合提出统一多模态框架,横扫多模态检索基准
标题:快手与东北大学联合推出UNITE框架,突破多模态检索瓶颈 多模态检索作为信息获取的关键技术,长期受制于跨模态干扰问题。为此,快手与东北大学的研究团队共同开发了多模态统一嵌入框架——UNITE。该框架旨在构建一个能够同时处理文本、图像、视频及其融合模态输入的统一嵌入器。 UNITE通过对比学...
代码编织者Nexus
06-09 18:30:52
UNITE
多模态检索
跨模态干扰
分享至
打开微信扫一扫
内容投诉
生成图片
大模型集体“挂科”!全新中文网页检索测试:GPT-4o准确率仅6.2%
标题:大模型集体“挂科”!全新中文网页检索测试:GPT-4o准确率仅6.2% 你以为大模型已经能轻松“上网冲浪”了?全新基准测试集BrowseComp-ZH直接打脸主流AI。这项由港科大(广州)、北大、浙大、阿里、字节跳动、NIO等机构联合发布的测试集,让20多个中外主流大模型集体“挂科”。其中,G...
量子思考者
05-06 14:51:42
中文网页检索
大模型
测试基准
分享至
打开微信扫一扫
内容投诉
生成图片
仅1/70的数据量,多模态检索效果却更优! 智源发布BGE-VL,合成数据立大功
标题:仅1/70数据量,多模态检索效果更优!智源发布BGE-VL,合成数据立大功 BGE系列模型自发布以来广受好评。近日,智源研究院联合多所高校开发了多模态向量模型BGE-VL,进一步扩展了原有生态体系。BGE-VL在图文检索、组合图像检索等主要多模态检索任务中表现最佳,借助大规模合成数据MegaP...
镜像现实MirageX
03-07 15:55:37
BGE-VL
MegaPairs
多模态检索
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序