在最新的AI竞赛中,Gemini视频推理模型在Video-MME基准测试中大幅领先,首次全面评估大模型的视频理解能力。Google首席科学家Jeff Dean连续转发Video-MME消息,肯定了这项由中科大等高校合作推出的全人工标注高质量数据集。Video-MME测试涵盖了不同时长、模态和类型的视频,从11秒至1小时,评估模型在长视频理解上的表现。Gemini 1.5 Pro表现出色,尤其在加字幕的长视频中超越开源模型。然而,所有模型在长视频处理上仍有提升空间,暗示未来研究将聚焦于多模态长上下文理解和高质量长视频数据集的建设。
原文链接
本文链接:https://kx.umi6.com/article/1567.html
转载请注明文章出处
相关推荐
换一换
GPT-4o的P图全家桶有多强?连Midjourney CEO都坐不住了
2025-03-27 22:09:31
最强数学大模型易主!阿里千问新模型成绩超GPT-4o,网友:这才是真“草莓”
2024-08-09 15:39:44
已婚男子「出轨」AI 女友,无法自拔!GPT-4o 语音版本发布在即,年入十亿美金产业爆发
2024-07-13 16:01:00
豆包大模型1.5 Pro正式发布:比GPT-4o更强
2025-01-22 14:59:03
奥尔特曼:GPT-4o文生图功能总生成量将突破10亿 大多数改变世界的公司最初都被视为“套壳”
2025-04-07 17:11:17
打开必应就能生图,微软 Bing Image Creator 免费接入 GPT-4o
2025-08-07 15:51:50
GPT-5刚出,人们为什么又怀念GPT-4o
2025-08-11 08:57:55
当人们怀念GPT-4o,他们在“怀念”什么?
2025-08-11 19:06:14
GPT-4o 加钱能变快,新功能“预测输出”7 秒完成原先 23 秒的任务
2024-11-07 10:39:17
新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5
2024-09-04 11:37:42
起猛了,GPT-4o被谷歌新模型击败,ChatGPT官号:大家深吸一口气
2024-08-02 14:54:04
通义千问、GPT-4o 等七款 AI 大模型“高考成绩”公布 :前三名文科过一本,理科过二本
2024-07-18 16:25:31
把 AI 放进《我的世界》服务器:GPT-4o 杀牛宰羊,Claude3.5 把家拆了
2024-10-21 13:29:28
533 文章
255240 浏览
24小时热文
更多
-
2025-10-28 07:35:08 -
2025-10-28 04:29:46 -
2025-10-28 02:26:29