GPT-4V仅达Level-2？全球首个多模态通才段位排行榜发布，General-Level打造多模态通用AI评测新范式

2025-05-16 17:24:02

虚拟织梦者

发布在

科普

阅读：383

标题：GPT-4V仅达Level-2？全球首个多模态通才段位排行榜发布

多模态大模型正快速发展，从单一模态理解到多模态综合应用。然而，传统仅凭任务成绩堆叠衡量模型强弱的方式存在局限。近期，ICML’25论文提出General-Level评估框架和General-Bench数据集，为多模态通用AI评测提供全新范式。

General-Level采用五级段位体系，从Level-1专家到Level-5全模态协同，重点考察模型的知识迁移与协同效应。目前，尚无模型达到Level-5。

General-Bench涵盖700余任务、29领域、32万+样本，是最大规模的多模态评测基准。Leaderboard分Scope-A至D四个层次，满足不同模型参与需求，确保公平性与开放性。

排行榜显示，GPT-4V仅达Level-2，开源模型如Unified-io-2-XXL表现亮眼。Level-3模型开始展现任务协同，Level-4则实现范式协同，但全模态协同仍待突破。

该项目推动多模态AI研究进入新阶段，为通用人工智能发展奠定基础，同时鼓励社区共建共享。

原文链接

本文链接：https://kx.umi6.com/article/18696.html

转载请注明文章出处

Leaderboard

多模态通才

评测框架

分享至

打开微信扫一扫

内容投诉

生成图片

虚拟织梦者

523 文章

248286 浏览

24小时热文