
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
近日,浙江大学联合上海人工智能实验室发布Creation-MMBench,全球首个面向真实场景的多模态创造力评测基准。该基准包含765个实例,覆盖五大任务类别及51项细粒度任务,专为评估多模态大模型的视觉创意智能设计。实验显示,开源模型Qwen2.5-VL与闭源模型GPT-4o在多模态任务中各有优劣,Gemini-2.0-Pro在日常与专业功能性写作上表现突出,但GPT-4.5整体表现稍逊,尤其在复杂视觉理解与创作上。团队还发现视觉指令微调可能限制模型的长文本创作能力。Creation-MMBench现已集成至VLMEvalKit,支持一键评测,推动多模态AI创造力研究。
原文链接
伦敦大学学院和华盛顿大学的研究表明,AI写作工具虽在进步,但尚无法媲美人类创造力。研究人员开发了DJ Search工具,能客观评估AI作品的新颖性。研究发现,AI在诗歌、小说和演讲领域的表现分别低于人类80%、100%和150%。AI更像DJ混音,缺乏真正的原创性。加州大学专家建议未来应评估整体叙事的原创性。这项研究强调了AI在模仿现有文本方面的能力,但仍有局限。
原文链接
加载更多

暂无内容