1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

近日,牛津、剑桥、帝国理工、多伦多等学术机构的研究成果登上《自然》杂志封面,揭示了AI训练AI技术面临的重大挑战。研究指出,在利用AI生成的数据训练AI模型时,模型会出现“崩溃”现象。这一现象发生在模型迭代过程中,导致模型产出内容逐渐失真,最终输出内容与原始数据分布相去甚远,甚至出现胡言乱语、事实错误及逻辑混乱等问题。研究通过实验验证,AI模型在连续迭代训练中,会逐渐吸收并放大自身生成数据的偏差,最终导致模型性能急剧下滑,难以准确反映真实世界。 该研究进一步指出,这一问题的核心在于AI模型在迭代过程中对自身生成数据的过度依赖,导致模型学习过程中的偏差累积,形成所谓的“模型崩溃”。研究团队提出了几种理论解释,通过分析数学模型,量化了AI模型崩溃的成因,包括统计近似误差、函数表达误差以及函数近似误差。这些理论揭示了AI模型在迭代训练过程中,如何在数据处理和学习过程中逐步偏离原始数据分布,最终导致模型性能的严重退化。 研究强调,AI模型在训练过程中应避免过度依赖自身生成的数据,而是应当结合真实世界的数据,以确保模型的稳定性和可靠性。同时,研究建议采用数据过滤、多样化的数据集以及开发更鲁棒的训练算法等方法,以减轻模型崩溃现象的影响。这一发现对AI领域产生了深远影响,提醒科研人员和开发者在构建AI模型时,需重视数据质量和多样性,以及模型训练策略的优化,以确保AI系统的准确性和实用性。

原文链接
本文链接:https://kx.umi6.com/article/3984.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
Nature最新封面:AI 训练 AI?也许越来越笨
2024-07-25 09:03:21
AI训AI惨遭投毒9次大崩溃,牛津剑桥等惊天发现登Nature封面
2024-07-25 19:17:55
谷歌研究:合成数据使大模型数学推理能力提升八倍
2025-04-07 09:47:20
散户组团挑战算力霸权,40B 模型 + 20 万亿 token 刷新世界纪录
2025-05-26 12:39:10
OpenAI 呼吁美国放宽版权限制,自由使用版权保护材料训练 AI 激发创新力
2025-03-14 07:58:58
合成数据服务商「卓印智能」获天使轮融资
2024-05-31 15:17:00
沈向洋院士:AI算力年均增长400%,讲卡伤感情、没卡没感情
2024-11-22 21:09:36
研究:反复使用 AI 生成的内容来训练 AI 可造成“模型崩溃”
2024-09-05 08:13:11
可保护作品免遭 AI 训练,Adobe 推出 Content Authenticity 应用
2025-04-24 22:48:39
为训练AI不择手段!Meta被曝下载数十TB盗版电子书
2025-02-09 11:43:34
英国版权法修订遭质疑,“内定”AI 训练版权豁免
2025-02-12 10:24:06
苹果揭秘 Apple 智能开发:差分隐私 + 合成数据,隐私原则贯穿 AI 技术演进
2025-04-15 08:18:58
创作心血变AI养料?网文作者“揭竿而起”
2024-07-30 19:30:57
24小时热文
更多
扫一扫体验小程序