1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

牛津、剑桥等顶尖学术机构联合发布的重要研究揭示了AI训练中的惊人问题——利用AI生成的数据训练AI模型时,模型会出现严重的性能衰减,即所谓的“模型崩溃”。这一现象发生在经过多次迭代后,模型开始产出诡异的乱码并直接崩溃。研究指出,合成数据在AI训练中如同近亲繁殖,导致质量下降,就像向数据集投毒一样。 研究发现,AI生成的数据训练模型时,模型会逐渐丢失对数据分布尾部信息的掌握,即低概率事件的信息会逐渐消失。这一过程被称为“模型崩溃”,会导致模型性能急剧下降。模型崩溃的现象不仅出现在大型语言模型(LLM)中,如GPT系列,还出现在变分自编码器(VAE)和高斯混合模型(GMM)等模型中。 研究团队通过一系列实验论证了这一现象,并提出了可能的解决策略,包括更多地使用人类生成的数据进行训练,以及在每一代模型训练时保留一定比例的原始数据。这一发现强调了高质量、真实数据的重要性,同时也警示了AI训练领域面临的关键挑战。 该研究登上了《自然》杂志封面,标志着AI训练领域的一个重大突破,提醒着AI开发者和研究者关注数据质量对模型性能的影响。这一发现对于正在快速发展的人工智能技术具有深远的意义,特别是在构建更可靠、更高效的AI系统方面。

原文链接
本文链接:https://kx.umi6.com/article/3989.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
合成数据服务商「卓印智能」获天使轮融资
2024-05-31 15:17:00
AI训AI惨遭投毒9次大崩溃,牛津剑桥等惊天发现登Nature封面
2024-07-25 19:17:55
英伟达被曝未经许可抓取 YouTube、Netflix 平台视频用于训练 AI
2024-08-06 14:52:00
自动截图玩家游戏画面训练AI 微软否认:只是为了识别
2025-10-26 18:22:58
小鹏汽车智驾负责人:每年投入35亿AI训练费用
2024-10-24 15:15:11
AI生成的数据,竟成为一枚射向自己的子弹?
2024-12-02 19:57:32
苹果用谷歌TPU训练AI,都怪英伟达太贵?
2024-08-01 11:35:01
合成数据企业「光轮智能」获数千万Pre-A轮融资,经纬创投领投
2024-05-31 11:12:14
Nature封面:AI训AI,越训越傻
2024-07-27 12:59:34
研究:反复使用 AI 生成的内容来训练 AI 可造成“模型崩溃”
2024-09-05 08:13:11
每天给白领发 1000 万,他成了硅谷最年轻亿万富翁
2025-11-17 13:24:29
英伟达黄仁勋长女 Madison Huang 直播首秀,聊了具身智能
2025-10-17 10:12:34
OpenAI和谷歌们,如何合法地“偷”你的数据训练AI?
2024-07-02 23:04:36
24小时热文
更多
扫一扫体验小程序