Nature杂志最新披露,学术出版商正将科研论文授权给科技公司,用于训练AI模型,已赚得盆满钵满。据报,英国学术出版商Taylor & Francis与微软达成协议,允许后者获取其数据,以改进AI系统,交易金额高达1000万美元。美国出版商Wiley则在一次投资者更新中透露,允许某公司使用其内容训练模型后,获利2300万美元,而论文作者对此毫无收益。 文章指出,论文从构思到成稿,凝聚了作者的辛勤劳动,如今却在作者不知情的情况下,被用于训练AI。数据集如黄金,各大公司争相高价购买高质量数据集。开源存储库arXiv和学术数据库PubMed的论文摘要尤其受到青睐,因为它们篇幅长,信息密度高,对训练AI模型极为宝贵。然而,论文作者并未从中受益。 面对版权争议,现有法律体系难以界定是否构成侵权。尽管如此,研究者仍尝试开发技术方法,如“版权陷阱”策略,以识别论文是否被AI模型使用。然而,证明论文曾被AI使用仍面临极大挑战。这一现象引发了关于AI伦理、公平性和版权保护的广泛讨论。同时,文章提及了利用arXiv论文构建多模态数据集的研究,旨在提高AI在理解科学图片和文本方面的能力。
原文链接
本文链接:https://kx.umi6.com/article/5044.html
转载请注明文章出处
相关推荐
.png)
换一换
DeepSeek惊艳全球,Nature是如何点评的?
2025-02-05 15:10:33
诺奖AI成果开源!AlphaFold3代码人人可以免费下,Nature撰文推荐
2024-11-12 18:12:16
00后国人论文登Nature,大模型对人类可靠性降低
2024-10-09 10:09:29
445 文章
77148 浏览
24小时热文
更多

-
2025-07-19 22:57:32
-
2025-07-19 21:58:20
-
2025-07-19 21:57:13