正文:2025年12月,中国联通数据科学与人工智能研究院在AAAI 2026 (Oral)发表新研究HiMo-CLIP,突破长文本图像检索难题。该模型通过建模“语义层级”与“语义单调性”,自动捕捉语境中的“语义差异点”,显著提升长文本和组合性文本的检索精度,同时兼顾短文本性能。HiMo-CLIP采用层级分解模块(HiDe)和单调性感知对比损失(MoLo),动态提取关键特征并优化图文对齐机制。实验显示,仅用1M训练数据,HiMo-CLIP性能超越使用100M甚至10B数据的现有方法,并在自建数据集HiMo-Docci上取得SOTA结果。
原文链接
本文链接:https://kx.umi6.com/article/29443.html
转载请注明文章出处
相关推荐
换一换
让大模型学会“高维找茬”,中国联通新研究解决长文本图像检索痛点|AAAI 2026 Oral
2025-12-01 17:18:28
中华人民共和国和法兰西共和国关于持续推进和平利用核能领域合作的联合声明
2025-12-05 13:31:00
中国互联网「反内卷」需要动真格的了
2025-12-05 09:14:30
“AI教父”警告:盖茨、马斯克没说错 数百万劳动者将被时代抛弃
2025-12-05 15:36:18
苹果陷AI困局 iPhone用户出现倒戈潮
2025-12-07 16:37:13
豆包手机助手:计划进一步限制AI对手机金融类应用的操作使用
2025-12-05 11:25:11
全球最大云厂商亚马逊 AWS,将“最牛马”的工作交给了 AI Agent
2025-12-07 18:39:34
黄仁勋很发愁!就算解禁H200 AI GPU 也不知道中国要不要
2025-12-05 12:26:47
山西“十五五”规划建议:加快建成辐射全国的煤炭、焦炭交易中心
2025-12-05 10:20:20
硅片,洗牌进行时
2025-12-07 14:30:16
Ilya刚预言完,世界首个原生多模态架构NEO就来了:视觉和语言彻底被焊死
2025-12-06 21:51:03
重构「短剧神话」的AI漫剧
2025-12-05 10:16:56
OpenAI、阿里、字节们的AI硬件战事:害怕错过下一代入口
2025-12-06 12:27:46
593 文章
352927 浏览
24小时热文
更多
-
2025-12-07 20:45:46 -
2025-12-07 18:40:26 -
2025-12-07 18:39:34