2025-05-16 17:24:02
GPT-4V仅达Level-2?全球首个多模态通才段位排行榜发布,General-Level打造多模态通用AI评测新范式
阅读:133
标题:GPT-4V仅达Level-2?全球首个多模态通才段位排行榜发布
多模态大模型正快速发展,从单一模态理解到多模态综合应用。然而,传统仅凭任务成绩堆叠衡量模型强弱的方式存在局限。近期,ICML’25论文提出General-Level评估框架和General-Bench数据集,为多模态通用AI评测提供全新范式。
General-Level采用五级段位体系,从Level-1专家到Level-5全模态协同,重点考察模型的知识迁移与协同效应。目前,尚无模型达到Level-5。
General-Bench涵盖700余任务、29领域、32万+样本,是最大规模的多模态评测基准。Leaderboard分Scope-A至D四个层次,满足不同模型参与需求,确保公平性与开放性。
排行榜显示,GPT-4V仅达Level-2,开源模型如Unified-io-2-XXL表现亮眼。Level-3模型开始展现任务协同,Level-4则实现范式协同,但全模态协同仍待突破。
该项目推动多模态AI研究进入新阶段,为通用人工智能发展奠定基础,同时鼓励社区共建共享。
原文链接
本文链接:https://kx.umi6.com/article/18696.html
转载请注明文章出处
相关推荐
.png)
换一换
AI编码史诗级翻车!竟一键删光客户整个生产数据库
2025-07-21 18:22:40
Nature刊文称“AI可模拟人类心智”,Science同日强烈质疑
2025-07-21 09:14:02
AI编码史诗级翻车:Replit一键删光客户数据库
2025-07-22 07:28:19
404 文章
54012 浏览
24小时热文
更多

-
2025-07-22 10:31:31
-
2025-07-22 10:30:21
-
2025-07-22 10:29:10