1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

【新闻速递】近日,由智源、北邮、北大和浙大等高校合作推出的首个多任务长视频理解评测基准MLVU发布,评估模型对长视频的全面掌握。GPT-4o在其中的单选正确率仅约65%,显示现有模型在处理长达数分钟至两小时的视频时面临挑战。研究发现,视频时长增加会导致性能下滑,提升上下文理解和图像解析能力至关重要。MLVU涵盖广泛时长和来源的视频,涉及9类任务,旨在测试模型的全面、单细节和多细节理解能力。实验结果显示,开源与闭源模型间存在显著差距,提示了未来长视频理解模型发展的方向。

原文链接
本文链接:https://kx.umi6.com/article/1894.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
重新体验GPT-5后,我想它比GPT-4o 更需要一场葬礼
2025-08-11 19:06:36
Llama 3.1提前泄密,将GPT-4o踹下宝座?更快,价格便宜10倍
2024-07-24 09:04:52
通义千问、GPT-4o 等七款 AI 大模型“高考成绩”公布 :前三名文科过一本,理科过二本
2024-07-18 16:25:31
“中杯”Claude 3.5深夜发布,能吊打GPT-4o?
2024-06-21 07:58:51
GPT-4即将“退役”!OpenAI宣布本月末起它将被GPT-4o替代
2025-04-14 16:42:54
GPT-4o掀起“吉卜力风”,连CEO奥特曼也换了头像!版权争议虽迟但到
2025-03-28 17:54:27
OpenAI 测试长输出版 GPT-4o:单次 64K tokens,每百万 tokens 输入 6 美元、输出 18 美元
2024-08-01 16:47:35
GPT-4o过于谄媚,“赛博舔狗”惹争议
2025-05-01 16:32:29
GPT-4o图像生成架构被“破解”了?自回归主干+扩散解码器
2025-04-09 17:59:20
OpenAI最新技术报告:GPT-4o变谄媚的原因万万没想到
2025-05-03 12:30:15
GPT-4o当选“最谄媚模型”!斯坦福牛津新基准:所有大模型都在讨好人类
2025-05-23 17:27:40
首次引入GPT-4o!图像自动评估新基准来啦
2024-06-28 00:32:37
GPT-4o图像生成今起免费!奥特曼坐镇紧急发布,指令遵循/文本控制表现惊艳
2025-03-26 10:43:57
24小时热文
更多
扫一扫体验小程序