1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

【新闻速递】近日,由智源、北邮、北大和浙大等高校合作推出的首个多任务长视频理解评测基准MLVU发布,评估模型对长视频的全面掌握。GPT-4o在其中的单选正确率仅约65%,显示现有模型在处理长达数分钟至两小时的视频时面临挑战。研究发现,视频时长增加会导致性能下滑,提升上下文理解和图像解析能力至关重要。MLVU涵盖广泛时长和来源的视频,涉及9类任务,旨在测试模型的全面、单细节和多细节理解能力。实验结果显示,开源与闭源模型间存在显著差距,提示了未来长视频理解模型发展的方向。

原文链接
本文链接:https://kx.umi6.com/article/1894.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
GPT-4o竟是「道德专家」?解答50道难题,比纽约大学教授更受欢迎
2024-07-06 01:29:48
商汤拟配售16.7亿股股份;GPT-4o劲敌Claude 3.5发布;我国人工智能企业数量已超4500家|AI daily早新闻
2024-06-21 11:20:11
GPT-4o被谷歌新模型Gemini 1.5 Pro超越
2024-08-02 16:24:53
GPT-4o过于谄媚,“赛博舔狗”惹争议
2025-05-01 16:32:29
因为GPT-5,这群人决定在Reddit上起义
2025-08-11 11:01:24
OpenAI回滚了最新版本的GPT-4o,因ChatGPT“过于谄媚”
2025-04-30 20:11:51
“中杯”Claude 3.5深夜发布,能吊打GPT-4o?
2024-06-21 07:58:51
GPT-4o怎么抢了Midjourney的饭碗
2025-04-11 11:41:06
豆包大模型1.5 Pro正式发布:比GPT-4o更强
2025-01-22 14:59:03
OpenAI升级GPT-4o模型 提升智能和个性
2025-04-26 17:56:17
ChatGPT 负责人复盘 GPT-4o 下架风波:过早下架属失误,后续将迭代模型人格
2025-09-18 14:53:31
全球网友喊话山姆·奥特曼: 还我GPT-4o
2025-08-13 15:40:26
打开必应就能生图,微软 Bing Image Creator 免费接入 GPT-4o
2025-08-07 15:51:50
24小时热文
更多
扫一扫体验小程序