1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

中科院人大百川团队提出VideoNIAH,一种新方法来测试大模型的视频理解能力。他们通过在视频中插入无关的图像或文本,创建VideoNIAH框架,生成多样化测试数据,评估模型对时间理解、细粒度理解、时空建模和长上下文处理的能力。VideoNIAH用于构建合成视频理解基准VNBench,包含1350个样本,测试了多种模型,发现专有模型如GPT-4o在特定任务上表现不佳,特别是计数和排序。VNBench的多样性设计使它能全面评估模型在不同视频长度、内容和查询条件下的性能,指出现有模型在长依赖和细粒度时空理解上还有提升空间。研究结果为视频理解技术发展提供了方向。

原文链接
本文链接:https://kx.umi6.com/article/1775.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
考考大模型视频理解能力,中科院人大百川提出新基准合成框架
2024-06-20 23:38:13
完全「跑」在 Claude Code 里,会发生什么?
2026-01-23 20:12:20
中国电信等在天津成立低空量子网络科技发展公司
2026-01-23 10:50:21
上海:适度超前布局建设新型信息基础设施 纵深推动“5G+工业互联网”
2026-01-23 10:48:11
超600家上市公司预告2025年业绩 新兴产业增势亮眼
2026-01-22 06:40:59
亚马逊又将大手笔裁员!AI被指罪魁祸首 高薪行政人员首当其冲
2026-01-23 12:56:24
苹果首款AI穿戴设备最早可能在2027年发布
2026-01-22 18:06:16
高通砸钱、雷军入股!刚刚,上海诞生一个183亿手机代工巨头
2026-01-22 18:04:11
34GB大礼包 AMD显卡AI生产力来了:ComfyUI等5大软件一键部署
2026-01-22 23:17:29
Future Tech | 16支AI新锐齐聚数码港,FT Demo Day第二期引爆湾区创新浪潮
2026-01-23 20:14:36
Anthropic下调其利润率预期
2026-01-22 11:52:20
中国政府只在特殊情况下批准购买H200芯片?商务部回应
2026-01-22 16:03:57
九骏踏浪,海淀这片“创新深海”做了啥?
2026-01-23 19:08:58
24小时热文
更多
扫一扫体验小程序