1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
Gemini视频推理遥遥领先GPT-4o,Jeff Dean连续转发三次,首个视频多模态基准Video-MME来了
在最新的AI竞赛中,Gemini视频推理模型在Video-MME基准测试中大幅领先,首次全面评估大模型的视频理解能力。Google首席科学家Jeff Dean连续转发Video-MME消息,肯定了这项由中科大等高校合作推出的全人工标注高质量数据集。Video-MME测试涵盖了不同时长、模态和类型的视频,从11秒至1小时,评估模型在长视频理解上的表现。Gemini 1.5 Pro表现出色,尤其在加字幕的长视频中超越开源模型。然而,所有模型在长视频处理上仍有提升空间,暗示未来研究将聚焦于多模态长上下文理解和高质量长视频数据集的建设。
未来笔触
06-18 13:20:37
Gemini 1.5 Pro
GPT-4o
Video-MME
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序