1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

近日,浙江大学联合上海人工智能实验室发布Creation-MMBench,全球首个面向真实场景的多模态创造力评测基准。该基准包含765个实例,覆盖五大任务类别及51项细粒度任务,专为评估多模态大模型的视觉创意智能设计。实验显示,开源模型Qwen2.5-VL与闭源模型GPT-4o在多模态任务中各有优劣,Gemini-2.0-Pro在日常与专业功能性写作上表现突出,但GPT-4.5整体表现稍逊,尤其在复杂视觉理解与创作上。团队还发现视觉指令微调可能限制模型的长文本创作能力。Creation-MMBench现已集成至VLMEvalKit,支持一键评测,推动多模态AI创造力研究。

原文链接
本文链接:https://kx.umi6.com/article/16703.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
拓元智慧完成近亿元人民币Pre-A轮融资
2024-12-31 17:46:35
事关下一代大模型!斯坦福顶尖1%科学家许主洪加盟阿里通义
2025-09-30 12:26:16
GPT-4.5 创造力比 GPT-4o 弱,浙大上海 AI Lab 发布全球首个面向真实场景的多模态创造力评测基准
2025-04-04 13:13:45
我国发布全球首个深海生境智能多模态大模型
2025-11-06 21:14:23
当虹科技上半年亏损收窄 研发投入下降
2025-08-23 08:59:00
阶跃星辰多模态大模型为OPPO新机提供技术支持
2025-04-22 16:25:15
王兴兴透露:宇树机器人已能完成绝大部分工作动作
2025-11-16 15:42:36
独家|商汤联合创始人林达华:开源模型与顶尖闭源模型的差距正在迅速缩小
2025-02-21 15:57:46
格灵深瞳:大模型是核心技术发展方向 何时扭亏成投资者关注话题|直击股东会
2024-08-21 10:32:00
多模态实力领跑开源大模型!阶跃星辰与吉利宣布联合开源两款多模态大模型
2025-02-18 10:16:14
多模态大模型学会反思和复盘,上交&上海AI Lab破解多模态复杂推理
2025-10-19 15:52:40
行业催化不断 机构看好AI主题行情
2024-12-24 05:22:47
SuperCLUE多模态视觉评测榜:文心4.5 Turbo总分并列国内第一
2025-08-28 21:28:42
24小时热文
更多
扫一扫体验小程序