人工智能训练数据耗尽了怎么办?
近日,马斯克在社交平台X的直播对话中表示,AI训练数据已在去年耗尽:“我们基本用尽了所有人类知识进行AI训练。”
马斯克的观点与前OpenAI首席科学家Ilya Sutskever一致。Sutskever曾表示,AI行业已达到“数据峰值”,训练数据不足将迫使AI开发方式改变。
对此,马斯克提出了解决方案:“唯一补充方法是使用合成数据,即AI自行生成的数据。通过合成数据,AI可自我评估并进行自学习。”
科技巨头如微软、Meta、OpenAI、Anthropic正采用合成数据训练AI模型。Gartner预计,2024年用于AI训练和分析项目的60%数据将是合成的。
微软开源的Phi-4模型和谷歌的Gemma模型均使用合成数据与真实数据共同训练。AI初创公司Writer称,其Palmyra X 004模型仅花费70万美元,远低于同等规模OpenAI模型的460万美元。
然而,合成数据也存在风险。一些研究表明,合成数据可能导致模型输出偏颇,甚至功能受损。因此,数据偏见和局限性可能会影响模型性能。
原文链接
本文链接:https://kx.umi6.com/article/11474.html
转载请注明文章出处
相关推荐
.png)
换一换
马斯克威胁:将立即对苹果采取法律行动
2025-08-12 18:23:47
马斯克称xAI代码库被盗 涉案员工已跳槽OpenAI
2025-09-01 14:19:22
OpenAI,向所有反对者“举刀”
2025-09-05 19:23:16
马斯克发布Grok 4,年费飚到2万+
2025-07-10 19:26:08
马斯克:特斯拉正在努力“超额生产”AI5芯片
2025-10-23 09:00:35
马斯克承认曾抵制人工智能,如今全力投入
2025-07-20 21:09:03
马斯克宣布 Grok 上线动漫 AI 伴侣功能,部分免费用户亦可试用
2025-07-15 09:38:22
AI女友正在变成马斯克的印钞机
2025-07-20 19:07:11
脑机接口前景广阔!Neuralink宏伟蓝图:到2031年年收入达10亿美元
2025-07-24 10:05:54
马斯克旗下xAI指控竞争对手OpenAI窃取商业机密
2025-09-25 22:13:25
马斯克炮轰 OpenAI 被微软拿捏,纳德拉回帖称期待 Grok 5 到来
2025-08-09 12:31:01
AI巨头陷版权风暴,免费的“数据盛宴”即将散场?
2025-09-08 09:56:18
马斯克发起编程人机大战!卡帕西说了不
2025-10-19 12:47:59
522 文章
246708 浏览
24小时热文
更多

-
2025-10-24 05:23:38
-
2025-10-24 03:21:23
-
2025-10-24 01:20:07