1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:“训练数据抄袭”:DeepSeek动了谁的奶酪?

正文: 有读者指出:DeepSeek V3 存在“训练数据抄袭”的问题。模型有时会产生奇怪的幻觉,如自称“GPT-4”,甚至讲的笑话也与GPT-4高度相似。这可能是训练数据受到污染所致。

大型语言模型(LLM)通过学习海量互联网文本数据(语料)进行训练。若这些数据中混入了特定模型(如GPT-4)的输出内容,新模型可能会模仿其特征,产生“幻觉”。DeepSeek V3 可能遭遇了这种情况,因互联网上有大量GPT-4生成的文本,可能无意间成为其训练数据的一部分。

除了技术问题,这还引发了行业问题:如何确定和使用AI内容的版权。现有版权法难以适用AI生成内容,其独创性在法律上仍有争议,影响传统内容创作者的利益。《纽约时报》起诉OpenAI和微软等案例反映了这种焦虑。

Scribd联合创始人Trip Adler的新项目“Created by Humans”尝试解决这一问题。该项目类似于欧美版的“视觉中国”,让创作者出售内容版权给AI公司。这通过新的商业模式平衡各方利益。尽管如此,如何将此模式扩展到多种内容类型仍需探索。

当前,AI对“语料”的使用处于无人监管的状态,内容作者缺乏话语权和议价能力,只能眼看着自己的权益受损。AI版权的边界和归属问题仍未达成共识,创作者面临严峻挑战。

原文链接
本文链接:https://kx.umi6.com/article/11003.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
梁文锋代表DeepSeek,他代表梁文锋
2025-11-16 12:31:32
被AI「摩擦」的十天:一个普通人的上手记
2025-08-16 18:28:03
鏖战2025年,大模型围着开源转
2025-12-25 18:55:44
李开复:如果十年后回顾 DeepSeek 如何让中国未落后美国,答案是开源
2025-09-27 12:40:23
奥尔特曼:DeepSeek 团队很有才华,但他们没找到比 OpenAI 更高效的方法
2025-07-21 21:22:47
DeepSeek官方点赞元宝,罕见现身互动
2025-12-24 17:46:41
DeepSeek催化下,芯片带领沪指突破3800点
2025-08-22 20:52:41
DeepSeek发布新论文提出更为高效的AI开发方法
2026-01-02 18:32:56
DeepSeek刷屏论文背后:除了梁文锋,还有一个18岁中国高中生,曾写出神级提示词
2025-09-19 11:14:40
黄仁勋新年第一场演讲提了DeepSeek 推动了整个行业变革
2026-01-06 08:54:05
AI音乐:从玩具到生意
2025-11-14 18:07:43
谷歌新发现:DeepSeek推理分裂出多重人格,左右脑互搏越来越聪明
2026-01-20 13:05:54
DeepSeek 开年发布新论文:提出全新 mHC 架构,梁文锋现身作者名单
2026-01-01 17:23:53
24小时热文
更多
扫一扫体验小程序