1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

牛津、剑桥等顶尖学术机构联合发布的重要研究揭示了AI训练中的惊人问题——利用AI生成的数据训练AI模型时,模型会出现严重的性能衰减,即所谓的“模型崩溃”。这一现象发生在经过多次迭代后,模型开始产出诡异的乱码并直接崩溃。研究指出,合成数据在AI训练中如同近亲繁殖,导致质量下降,就像向数据集投毒一样。 研究发现,AI生成的数据训练模型时,模型会逐渐丢失对数据分布尾部信息的掌握,即低概率事件的信息会逐渐消失。这一过程被称为“模型崩溃”,会导致模型性能急剧下降。模型崩溃的现象不仅出现在大型语言模型(LLM)中,如GPT系列,还出现在变分自编码器(VAE)和高斯混合模型(GMM)等模型中。 研究团队通过一系列实验论证了这一现象,并提出了可能的解决策略,包括更多地使用人类生成的数据进行训练,以及在每一代模型训练时保留一定比例的原始数据。这一发现强调了高质量、真实数据的重要性,同时也警示了AI训练领域面临的关键挑战。 该研究登上了《自然》杂志封面,标志着AI训练领域的一个重大突破,提醒着AI开发者和研究者关注数据质量对模型性能的影响。这一发现对于正在快速发展的人工智能技术具有深远的意义,特别是在构建更可靠、更高效的AI系统方面。

原文链接
本文链接:https://kx.umi6.com/article/3989.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
马斯克:AI训练去年就已耗尽现实世界的所有资料
2025-01-13 17:57:57
剥离Chrome还不够?美司法部寻求剥离安卓系统,限制AI训练
2024-11-22 20:09:06
网文作者打响AI训练反击战
2024-07-26 10:52:06
“死亡互联网理论”刷屏硅谷
2025-10-20 07:59:52
互联网巨头,如何合法地「偷」你的数据训练 AI?
2024-07-03 05:47:37
AI苦工卷向高学历
2024-07-03 19:25:10
训练AI,然后被裁?
2025-11-27 17:47:25
Gmail 被指“拿用户邮件训练 AI”,谷歌否认
2025-11-22 16:25:05
苹果揭秘 Apple 智能开发:差分隐私 + 合成数据,隐私原则贯穿 AI 技术演进
2025-04-15 08:18:58
Claude 用户注意:聊天记录将被用于 AI 训练,默认同意
2025-08-29 09:37:27
英伟达被曝未经许可抓取 YouTube、Netflix 平台视频用于训练 AI
2024-08-06 14:52:00
沈向洋院士:AI算力年均增长400%,讲卡伤感情、没卡没感情
2024-11-22 21:09:36
微软面临新版权诉讼:未经许可用盗版书训练 AI
2025-06-26 08:57:30
24小时热文
更多
扫一扫体验小程序