中科院人大百川团队提出VideoNIAH,一种新方法来测试大模型的视频理解能力。他们通过在视频中插入无关的图像或文本,创建VideoNIAH框架,生成多样化测试数据,评估模型对时间理解、细粒度理解、时空建模和长上下文处理的能力。VideoNIAH用于构建合成视频理解基准VNBench,包含1350个样本,测试了多种模型,发现专有模型如GPT-4o在特定任务上表现不佳,特别是计数和排序。VNBench的多样性设计使它能全面评估模型在不同视频长度、内容和查询条件下的性能,指出现有模型在长依赖和细粒度时空理解上还有提升空间。研究结果为视频理解技术发展提供了方向。
原文链接
本文链接:https://kx.umi6.com/article/1775.html
转载请注明文章出处
相关推荐
换一换
考考大模型视频理解能力,中科院人大百川提出新基准合成框架
2024-06-20 23:38:13
高盛:对冲基金对AI投资敞口达到近9年来新高 押注亚股和美股将上涨
2025-10-24 18:49:20
友情明码标价,他们花钱「租网友聊天」
2025-10-25 08:14:19
自动驾驶,走出青春期
2025-10-23 15:09:02
SEMI:预计2025年全球半导体销售额超7000亿美元 2030年目标突破1万亿美元
2025-10-24 17:47:14
OpenAI收购macOS供应商,剑指GPT操作系统!微软也不装了
2025-10-24 14:39:11
FM Agent登顶OpenAI MLE-Bench,由百度智能云研发
2025-10-24 17:44:39
OPPO与蚂蚁集团签署战略合作 将共建AI智能体等
2025-10-24 12:40:26
谷歌放大招!Gemini「吞下」2.5亿地图数据,路痴AI一夜成精
2025-10-24 11:33:27
百镜大战再添把火!阿里夸克AI眼镜即将开启预售
2025-10-23 15:12:35
大模型推理学习新范式!ExGRPO框架:从盲目刷题到聪明复盘
2025-10-23 17:10:54
对冲基金大佬对AI热潮“敬而远之”,更青睐这项技术……
2025-10-23 16:10:22
Mobileye连续三个季度营收同比增长,EyeQ芯片出货量持续增长
2025-10-24 11:32:17
522 文章
244088 浏览
24小时热文
更多
-
2025-10-25 12:21:03 -
2025-10-25 12:20:19 -
2025-10-25 10:17:38