中文数据为什么成了“互联网孤岛”？

2024-07-16 14:55:50

中文数据为什么成了“互联网孤岛”？

像素宇宙

发布在

快讯

阅读：500

中文数据在AI大模型发展中遭遇困境，被视为"互联网孤岛"。由于数据分散、质量低和短缺，中国AI大模型依赖英文开源语料，中文语料尤其是高质量数据匮乏，导致模型思维西式化。国家数据局报告显示，尽管中国数据总量庞大，但仍面临有效供给不足和价值释放难题。为破局，国家和企业正在推动数据共享计划，如开源数据集、共建共享和“数算一体”模式，尝试解决数据孤岛问题。专家建议市场机制和数据联盟将是未来趋势，以促进数据的高效利用和价值发挥。

原文链接

本文链接：https://kx.umi6.com/article/3408.html

转载请注明文章出处

中文数据