谷歌DeepMind团队于2月13日发布了WebLI-100B数据集,这是一个包含1000亿图像-文本对的千亿级数据集,旨在提升AI视觉语言模型的文化多样性和多语言性。当前的视觉语言模型受限于现有数据集的语言偏差和文化代表性不足。WebLI-100B通过不进行激进过滤,保留更广泛的语言和文化元素,使得模型在文化和多语言任务上的表现更加优越。该数据集在文化多样性任务和低资源语言检索方面表现出显著改进。
原文链接
本文链接:https://kx.umi6.com/article/13394.html
转载请注明文章出处
相关推荐
.png)
换一换
OpenAI 6个月赚34亿美元,年化收入直接翻倍,却遭CTO揭底:ChatGPT与免费模型差距不大
2024-06-13 15:48:21
美方据报要求台积电对7纳米AI芯片实施出口限制 商务部回应
2024-11-14 16:21:51
中国最强科技公司!黄仁勋为何又力挺华为:计算、网络技术等强到可怕
2025-05-02 08:54:03
479 文章
76583 浏览
24小时热文
更多

-
2025-07-18 23:46:25
-
2025-07-18 22:47:06
-
2025-07-18 22:46:21