人工智能训练数据耗尽了怎么办?
近日,马斯克在社交平台X的直播对话中表示,AI训练数据已在去年耗尽:“我们基本用尽了所有人类知识进行AI训练。”
马斯克的观点与前OpenAI首席科学家Ilya Sutskever一致。Sutskever曾表示,AI行业已达到“数据峰值”,训练数据不足将迫使AI开发方式改变。
对此,马斯克提出了解决方案:“唯一补充方法是使用合成数据,即AI自行生成的数据。通过合成数据,AI可自我评估并进行自学习。”
科技巨头如微软、Meta、OpenAI、Anthropic正采用合成数据训练AI模型。Gartner预计,2024年用于AI训练和分析项目的60%数据将是合成的。
微软开源的Phi-4模型和谷歌的Gemma模型均使用合成数据与真实数据共同训练。AI初创公司Writer称,其Palmyra X 004模型仅花费70万美元,远低于同等规模OpenAI模型的460万美元。
然而,合成数据也存在风险。一些研究表明,合成数据可能导致模型输出偏颇,甚至功能受损。因此,数据偏见和局限性可能会影响模型性能。
原文链接
本文链接:https://kx.umi6.com/article/11474.html
转载请注明文章出处
相关推荐
.png)
换一换
马斯克又画饼了:机器人擎天柱即将开启试生产 明年产能是今年10倍
2025-03-21 12:21:58
AI三小时做的小游戏,9天赚12万!马斯克:AI游戏前景无限
2025-03-03 17:27:42
马斯克的12分,也快扣光了
2025-03-03 13:19:25
425 文章
65741 浏览
24小时热文
更多

-
2025-07-19 14:57:21
-
2025-07-19 14:56:08
-
2025-07-19 14:55:01