1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

在最新的AI竞赛中,Gemini视频推理模型在Video-MME基准测试中大幅领先,首次全面评估大模型的视频理解能力。Google首席科学家Jeff Dean连续转发Video-MME消息,肯定了这项由中科大等高校合作推出的全人工标注高质量数据集。Video-MME测试涵盖了不同时长、模态和类型的视频,从11秒至1小时,评估模型在长视频理解上的表现。Gemini 1.5 Pro表现出色,尤其在加字幕的长视频中超越开源模型。然而,所有模型在长视频处理上仍有提升空间,暗示未来研究将聚焦于多模态长上下文理解和高质量长视频数据集的建设。

原文链接
本文链接:https://kx.umi6.com/article/1567.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
OpenAI 测试长输出版 GPT-4o:单次 64K tokens,每百万 tokens 输入 6 美元、输出 18 美元
2024-08-01 16:47:35
GPT-4o怎么抢了Midjourney的饭碗
2025-04-11 11:41:06
OpenAI或为GPT-4o生图功能添加标识水印
2025-04-08 09:45:19
一手测评Claude 3.5,它真比GPT-4o强吗?
2024-06-21 22:15:17
GPT-4o 加钱能变快,新功能“预测输出”7 秒完成原先 23 秒的任务
2024-11-07 10:39:17
OpenAI 发布最新技术报告,揭秘 GPT-4o 变谄媚的原因
2025-05-03 16:36:59
通义千问、GPT-4o 等七款 AI 大模型“高考成绩”公布 :前三名文科过一本,理科过二本
2024-07-18 16:25:31
GPT-4o的P图全家桶有多强?连Midjourney CEO都坐不住了
2025-03-27 22:09:31
起猛了,GPT-4o被谷歌新模型击败,ChatGPT官号:大家深吸一口气
2024-08-02 14:54:04
提示词用上“过去式“,秒破GPT4o等六大模型安全限制!中文语境也好使
2024-07-19 15:57:37
奥尔特曼听劝:OpenAI 将提升订阅用户推理配额,恢复 GPT-4o 等旧模型
2025-08-11 07:56:08
微软 Copilot 已支持 GPT-4o 图像生成技术,能力大提升
2025-05-19 19:24:47
奥尔特曼:GPT-4o文生图功能总生成量将突破10亿 大多数改变世界的公司最初都被视为“套壳”
2025-04-07 17:11:17
24小时热文
更多
扫一扫体验小程序