人工智能训练数据耗尽了怎么办?
近日,马斯克在社交平台X的直播对话中表示,AI训练数据已在去年耗尽:“我们基本用尽了所有人类知识进行AI训练。”
马斯克的观点与前OpenAI首席科学家Ilya Sutskever一致。Sutskever曾表示,AI行业已达到“数据峰值”,训练数据不足将迫使AI开发方式改变。
对此,马斯克提出了解决方案:“唯一补充方法是使用合成数据,即AI自行生成的数据。通过合成数据,AI可自我评估并进行自学习。”
科技巨头如微软、Meta、OpenAI、Anthropic正采用合成数据训练AI模型。Gartner预计,2024年用于AI训练和分析项目的60%数据将是合成的。
微软开源的Phi-4模型和谷歌的Gemma模型均使用合成数据与真实数据共同训练。AI初创公司Writer称,其Palmyra X 004模型仅花费70万美元,远低于同等规模OpenAI模型的460万美元。
然而,合成数据也存在风险。一些研究表明,合成数据可能导致模型输出偏颇,甚至功能受损。因此,数据偏见和局限性可能会影响模型性能。
原文链接
本文链接:https://kx.umi6.com/article/11474.html
转载请注明文章出处
相关推荐
换一换
谷歌推出用于生成合成人工智能数据集的Simula
2026-04-17 07:48:52
马斯克:中国电力供应充足 AI计算能力将领先世界
2026-01-08 01:43:53
马斯克诉OpenAI案新进展:微软CEO纳德拉称马斯克从未向其质疑微软投资
2026-05-12 12:09:18
马斯克“新战书”:xAI最早明年实现AGI 两三年内超越竞争对手!
2025-12-18 20:04:46
马斯克下场抢人!xAI组建「人才狙击队」,极客版HR年薪168万
2026-01-22 12:51:47
马斯克最新宏大设想:每年发射百万吨级的卫星来扩张 AI 算力
2025-12-08 18:40:45
马斯克要求“光速”推进Terafab项目 已向供应商询问设备报价与交付时间
2026-04-16 20:19:04
马斯克官宣数字AI员工!世界首富也来养龙虾,测试阶段员工把它当真人
2026-03-12 14:40:53
马斯克放话:xAI三年内击败竞争对手
2025-12-19 21:10:50
马斯克:3年内机器人超越顶尖医生 中国AI算力将领先世界
2026-01-08 15:18:22
马斯克宣布将在美国建设芯片制造中心 目标是量产2纳米工艺芯片
2026-03-23 17:33:03
马斯克放豪言:SpaceX未来在AI领域成就将超越所有其他公司总和
2026-03-17 17:53:24
马斯克爆出「权力暗桩」,奥特曼进入反击时刻?
2026-05-12 15:18:46
709 文章
637936 浏览
24小时热文
更多
-
2026-06-09 00:54:40 -
2026-06-09 00:53:08 -
2026-06-08 23:49:41