
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
美国加州北区法院近日对两起AI训练素材版权案作出简易判决,首次明确AI训练中的合理使用边界。在作家诉Anthropic案中,法院认定合法购买书籍扫描为电子版用于训练属合理使用,但通过盗版网站下载内容仍构成侵权。Meta案中,法院认为其使用BT种子下载盗版图书训练Llama模型具有转换性,不构成市场替代,亦属合理使用。两案反映出中美在AI产业发展与版权监管间的博弈差异,美国法院对AI产业持较宽松态度,而欧盟则倾向严格合规。判决涉及数据取得、训练和输出三个核心问题,强调盗版素材不可接受,但正版转化及训练行为可适用合理使用原则。我国预计也将陆续出现类似案件的一审判决。
原文链接
3月26日,据WinBuzzer报道,Meta因涉嫌深度参与数字图书盗版链而引发关注。研究显示,Meta利用LibGen、Z-Library等“影子图书馆”的盗版书籍训练AI模型,并通过BitTorrent重新上传约30%的已下载书籍,延长了盗版传播周期。尽管Meta曾辩称下载未涉及种子分享,但新研究质疑其行为合法性。澳大利亚前总理特恩布尔及普利策奖得主夏邦等人已提起诉讼,指控Meta“大规模掠夺”版权作品。法国出版商也加入诉讼阵营。此事件或影响AI行业数据获取规则,欧盟委员会正关注,或将依据《欧盟AI法案》处理。案件尚无定论,但将成为数字时代版权保护的重要案例。
原文链接
Meta因未经授权下载数十TB盗版电子书用于AI训练被诉。据泄露邮件,Meta承认下载了有争议的数据集LibGen,包含数千万本盗版书籍。Meta通过“安娜的档案”下载了至少81.7TB数据,其中35.7TB来自Z-Library和LibGen。作者估计这只是Meta盗版行为的一小部分。Meta员工意识到法律风险,但仍决定继续,试图通过非Meta服务器规避风险。此事发生在2023年,揭示了Meta潜在的大规模盗版行为。
原文链接
2月7日,Ars Technica报道Meta公司因AI模型训练数据来源再次陷入法律纠纷。原告披露的邮件显示,Meta不仅知晓使用LibGen数据库进行AI训练涉及盗版,还试图掩盖通过种子下载方式获取至少81.7TB数据的行为,甚至采用“隐身模式”。Meta研究员Frank Zhang的邮件透露,为了避免追踪,下载数据时未使用Facebook服务器。高管迈克尔・克拉克证实Meta修改设置以减少种子传播。邮件显示使用LibGen的决定已上报给马克・扎克伯格,这与扎克伯格先前不知情的证词相矛盾。Meta坚称合理使用,但新证据使其处境更加复杂。
原文链接
日本文化厅计划借助AI系统追踪盗版网站,以应对每年因盗版导致的数十亿美元经济损失。据出版商团体透露,目前至少有1000个网站非法提供免费下载的本土动漫和漫画内容,其中以漫画最为普遍。为此,文化厅提议投入3亿日元(约1457万元人民币)启动试点项目,利用图像和文本识别技术,借助AI追踪盗版漫画和动画网站。文化厅官员Momii Keiko表示,版权方需耗费大量人力资源手动查找盗版内容,而人工审核难以应对层出不穷的非法内容。该计划已纳入文化厅本财年的追加预算申请中,本财年将于明年3月结束。若试点成功,此方法或将推广至其他影视和音乐内容领域。据统计,2022年,日本游戏、动漫和漫画产业在海外收入达4.7万亿日元(约2282.55亿元人民币),接近同年微芯片出口额。 (IT之家 12月4日报道)
原文链接
AI公司Anthropic因涉嫌使用盗版书籍训练其AI模型,遭到一群作家的集体诉讼。诉讼于8月21日在加州法院提起,指控Anthropic通过非法获取数万本受版权保护的书籍建立了价值数十亿美元的业务。该争议聚焦在其AI训练数据集"The Pile"中的"Books3"部分,此数据集包含Stephen King、Michael Pollan等知名作家的作品。Anthropic已确认使用了该数据集进行Claude系列AI聊天机器人的训练。作者们认为,Anthropic明知数据集来源涉及盗版,且包含从Bibiliotik等盗版网站获取的受版权保护内容。诉讼请求法院批准集体诉讼,要求Anthropic支付赔偿金并禁止未来使用受版权保护的材料。此事件与去年Meta、微软和EleutherAI等公司因涉嫌盗用作品训练AI模型而被多位知名作家起诉的案件相呼应。
原文链接
加载更多

暂无内容