1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

【新闻速递】近日,由智源、北邮、北大和浙大等高校合作推出的首个多任务长视频理解评测基准MLVU发布,评估模型对长视频的全面掌握。GPT-4o在其中的单选正确率仅约65%,显示现有模型在处理长达数分钟至两小时的视频时面临挑战。研究发现,视频时长增加会导致性能下滑,提升上下文理解和图像解析能力至关重要。MLVU涵盖广泛时长和来源的视频,涉及9类任务,旨在测试模型的全面、单细节和多细节理解能力。实验结果显示,开源与闭源模型间存在显著差距,提示了未来长视频理解模型发展的方向。

原文链接
本文链接:https://kx.umi6.com/article/1894.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
一手体验:最新发布的GPT-4o多模态生图,就是当今的王
2025-03-26 18:05:08
OpenAI GPT-4o AI 模型再升级,智能与个性双提升
2025-04-26 14:47:21
百川智能发布全链路领域增强金融大模型 Baichuan4-Finance,测试成绩领先 GPT-4o
2024-12-23 11:53:01
零一万物新旗舰模型 Yi-Lightning 发布:LMSYS 测试国产首次超越 GPT-4o,中国第一、世界第六
2024-10-17 09:59:42
过于追求人性化:奥尔特曼称 GPT-4o 出现“谄媚烦人”倾向,OpenAI 计划在一周内修复
2025-04-28 09:46:16
Llama 3.1磁力链提前泄露,开源模型王座一夜易主,GPT-4o被超越
2024-07-23 12:59:35
空间智能版ImageNet来了!李飞飞吴佳俊团队出品
2024-11-11 16:11:01
交互效果对标 GPT-4o,商汤发布国内首个所见即所得模型“日日新 5o”
2024-07-05 22:48:41
Claude3.5突然发布!GPT-4o不香了
2024-06-21 01:58:30
首次引入GPT-4o!图像自动评估新基准来啦
2024-06-28 00:32:37
OpenAI 切断 FoloToy 公司 GPT-4o 访问权限,后者旗下 AI 玩具曾教小孩如何点火柴、谈论性话题
2025-11-18 17:28:08
GPT-4o图像生成今起免费!奥特曼坐镇紧急发布,指令遵循/文本控制表现惊艳
2025-03-26 10:43:57
OpenAI回滚了最新版本的GPT-4o,因ChatGPT“过于谄媚”
2025-04-30 20:11:51
24小时热文
更多
扫一扫体验小程序