
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
标题:多模态模型免微调接入互联网,即插即用新框架,效果超闭源方案
一个5月份完成训练的大模型无法回答关于《黑神话·悟空》的问题,因为它缺乏相关训练数据。频繁更新大模型参数不切实际,但现实世界的信息是实时产生的。为此,上海人工智能实验室、北京理工大学、浙江大学和香港大学联合提出即插即用的SearchL...
原文链接
新型开源数据集MMDU(Multi-Turn Multi-Image Dialog Understanding)近日发布,让AI聊天更接近现实。这个数据集支持多轮对话(最多27轮)和同时输入20张图像,评估模型在处理长上下文和复杂交互场景中的能力。MMDU通过18k文本+图像tokens,提供了开放式评估,挑战现有LVLMs在多图多轮对话中的表现。研究团队已将其成果置于HuggingFace 6月18日Daily Papers榜首,引发全球关注。通过与GPT-4o结合,MMDU有望缩小开源与闭源模型的差距,并提升LVLMs在长文本理解和图文对话任务中的性能。
原文链接
加载更多

暂无内容