1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

近日,牛津、剑桥、帝国理工、多伦多等学术机构的研究成果登上《自然》杂志封面,揭示了AI训练AI技术面临的重大挑战。研究指出,在利用AI生成的数据训练AI模型时,模型会出现“崩溃”现象。这一现象发生在模型迭代过程中,导致模型产出内容逐渐失真,最终输出内容与原始数据分布相去甚远,甚至出现胡言乱语、事实错误及逻辑混乱等问题。研究通过实验验证,AI模型在连续迭代训练中,会逐渐吸收并放大自身生成数据的偏差,最终导致模型性能急剧下滑,难以准确反映真实世界。 该研究进一步指出,这一问题的核心在于AI模型在迭代过程中对自身生成数据的过度依赖,导致模型学习过程中的偏差累积,形成所谓的“模型崩溃”。研究团队提出了几种理论解释,通过分析数学模型,量化了AI模型崩溃的成因,包括统计近似误差、函数表达误差以及函数近似误差。这些理论揭示了AI模型在迭代训练过程中,如何在数据处理和学习过程中逐步偏离原始数据分布,最终导致模型性能的严重退化。 研究强调,AI模型在训练过程中应避免过度依赖自身生成的数据,而是应当结合真实世界的数据,以确保模型的稳定性和可靠性。同时,研究建议采用数据过滤、多样化的数据集以及开发更鲁棒的训练算法等方法,以减轻模型崩溃现象的影响。这一发现对AI领域产生了深远影响,提醒科研人员和开发者在构建AI模型时,需重视数据质量和多样性,以及模型训练策略的优化,以确保AI系统的准确性和实用性。

原文链接
本文链接:https://kx.umi6.com/article/3984.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
微软旗下 LinkedIn 默认共享用户数据用于 AI 训练,遭集体诉讼
2025-01-23 22:26:52
可保护作品免遭 AI 训练,Adobe 推出 Content Authenticity 应用
2025-04-24 22:48:39
沈向洋:今天一定要做的一件事是AI For Science|AI锋线
2024-11-26 13:31:54
谷歌研究:合成数据使大模型数学推理能力提升八倍
2025-04-07 09:47:20
Meta 为使用盗版素材训练 AI 辩护:下载不分享即合法
2025-02-21 22:59:57
340B险胜70B,Kimi机器人贴脸“嘲讽”英伟达新开源模型
2024-06-19 17:48:44
奇葩应用爆火美国App Store:用户卖隐私换钱 AI训练新生意引争议
2025-09-25 17:10:04
苹果用谷歌TPU训练AI,都怪英伟达太贵?
2024-08-01 11:35:01
马斯克:AI训练去年就已耗尽现实世界的所有资料
2025-01-13 17:57:57
“死亡互联网理论”刷屏硅谷
2025-10-20 07:59:52
互联网巨头,如何合法地「偷」你的数据训练 AI?
2024-07-03 05:47:37
Figure向真实世界挤了挤
2025-09-20 19:34:07
Meta Facebook 新增 AI 拼贴照片编辑功能引隐私争议,用户利用平台工具修图即被视为训练素材
2025-10-18 07:29:23
24小时热文
更多
扫一扫体验小程序