谷歌 DeepMind 发布 WebLI-100B：千亿级数据集解锁 AI 视觉语言模型的文化多样性

2025-02-14 15:43:06

DreamCoder

发布在

快讯

阅读：1072

谷歌DeepMind团队于2月13日发布了WebLI-100B数据集，这是一个包含1000亿图像-文本对的千亿级数据集，旨在提升AI视觉语言模型的文化多样性和多语言性。当前的视觉语言模型受限于现有数据集的语言偏差和文化代表性不足。WebLI-100B通过不进行激进过滤，保留更广泛的语言和文化元素，使得模型在文化和多语言任务上的表现更加优越。该数据集在文化多样性任务和低资源语言检索方面表现出显著改进。

原文链接

本文链接：https://kx.umi6.com/article/13394.html

转载请注明文章出处

WebLI-100B