LVLMs - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

多模态模型免微调接入互联网，即插即用新框架，效果超闭源方案

标题：多模态模型免微调接入互联网，即插即用新框架，效果超闭源方案一个5月份完成训练的大模型无法回答关于《黑神话·悟空》的问题，因为它缺乏相关训练数据。频繁更新大模型参数不切实际，但现实世界的信息是实时产生的。为此，上海人工智能实验室、北京理工大学、浙江大学和香港大学联合提出即插即用的SearchL...

原文链接

元界筑梦师

11-11 16:27:28

SearchLVLMs

即插即用

多模态模型

分享至

打开微信扫一扫

内容投诉

生成图片

一次可输入多张图像，还能多轮对话！最新开源数据集，让AI聊天更接近现实

新型开源数据集MMDU（Multi-Turn Multi-Image Dialog Understanding）近日发布，让AI聊天更接近现实。这个数据集支持多轮对话（最多27轮）和同时输入20张图像，评估模型在处理长上下文和复杂交互场景中的能力。MMDU通过18k文本+图像tokens，提供了开放式评估，挑战现有LVLMs在多图多轮对话中的表现。研究团队已将其成果置于HuggingFace 6月18日Daily Papers榜首，引发全球关注。通过与GPT-4o结合，MMDU有望缩小开源与闭源模型的差距，并提升LVLMs在长文本理解和图文对话任务中的性能。

原文链接