1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

近日,浙江大学联合上海人工智能实验室发布Creation-MMBench,全球首个面向真实场景的多模态创造力评测基准。该基准包含765个实例,覆盖五大任务类别及51项细粒度任务,专为评估多模态大模型的视觉创意智能设计。实验显示,开源模型Qwen2.5-VL与闭源模型GPT-4o在多模态任务中各有优劣,Gemini-2.0-Pro在日常与专业功能性写作上表现突出,但GPT-4.5整体表现稍逊,尤其在复杂视觉理解与创作上。团队还发现视觉指令微调可能限制模型的长文本创作能力。Creation-MMBench现已集成至VLMEvalKit,支持一键评测,推动多模态AI创造力研究。

原文链接
本文链接:https://kx.umi6.com/article/16703.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
CVPR2025视频生成统一评估架构,上交x斯坦福联合提出让MLLM像人类一样打分
2025-06-12 17:39:33
多模态大模型崛起:IP和创作者的新时代
2025-04-17 18:47:50
密室逃脱成AI新考场,通关率不足50%,暴露空间推理短板丨清华ICCV25
2025-07-14 14:19:19
西部证券:具有视觉能力的多模态大模型将对视觉 SoC和存储带来新需求
2024-12-16 10:00:06
阶跃星辰联合吉利首次开源 Step 系列多模态大模型,包含视频、语音两款模型
2025-02-18 11:13:42
上海AI实验室开源通用多模态大模型书生·万象3.5
2025-09-03 20:52:29
2025十大AI技术趋势:具身智能、世界模型都有望迎来ChatGPT时刻
2025-01-09 11:54:47
全球四项第一!优必选自研人形机器人最强大脑Thinker登顶全球
2025-09-09 12:12:13
阶跃星辰走“窄门”
2025-06-12 22:41:52
多模态大模型事实正确性评估:o1最强,模型普遍过于自信,最擅长现代建筑/工程技术/科学
2025-02-23 14:57:45
上海WAIC大会现场“大闹天宫”:模型够猛,产品够酷,公司够强
2024-07-04 23:04:31
全球首个多模态世界模型Emu3来了!智源王仲远:为多模态大模型训练范式指明新方向
2024-10-22 19:16:13
SuperCLUE多模态视觉评测榜:文心4.5 Turbo总分并列国内第一
2025-08-28 21:28:42
24小时热文
更多
扫一扫体验小程序