1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

新型开源数据集MMDU(Multi-Turn Multi-Image Dialog Understanding)近日发布,让AI聊天更接近现实。这个数据集支持多轮对话(最多27轮)和同时输入20张图像,评估模型在处理长上下文和复杂交互场景中的能力。MMDU通过18k文本+图像tokens,提供了开放式评估,挑战现有LVLMs在多图多轮对话中的表现。研究团队已将其成果置于HuggingFace 6月18日Daily Papers榜首,引发全球关注。通过与GPT-4o结合,MMDU有望缩小开源与闭源模型的差距,并提升LVLMs在长文本理解和图文对话任务中的性能。

原文链接
本文链接:https://kx.umi6.com/article/2362.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
一次可输入多张图像,还能多轮对话!最新开源数据集,让AI聊天更接近现实
2024-06-29 14:52:42
34GB大礼包 AMD显卡AI生产力来了:ComfyUI等5大软件一键部署
2026-01-22 23:17:29
广东:推广邮政快递末端智能收派服务 推动无人车、无人机与智能快件箱协同配送
2026-01-21 17:22:35
中国团队首次在Nature子刊发布医疗AI标准,未来医生MedGPT摘得全球桂冠
2026-01-21 13:06:32
微软打包收购OpenAI?就差一点!
2026-01-21 17:19:03
百度发布文心大模型5.0正式版
2026-01-22 10:49:05
“格陵兰纷争”冲击美股 知名分析师建议趁机买入AI科技股
2026-01-21 15:19:59
57.1%的人分不清真假!Runway新视频模型太爆炸
2026-01-22 14:56:01
广东:支持各地市稳妥有序开放自动驾驶多场景道路测试应用 扩大高级别自动驾驶应用区域
2026-01-21 17:22:28
纳德拉达沃斯警示:没电,AI全是空谈
2026-01-22 04:36:47
快手可灵AI月活突破1200万
2026-01-21 15:18:50
欧盟提出《数字网络法案》拟统一网络连接规则
2026-01-21 19:24:13
高通砸钱、雷军入股!刚刚,上海诞生一个183亿手机代工巨头
2026-01-22 18:04:11
24小时热文
更多
扫一扫体验小程序