【AI训练AI引发新担忧】牛津、剑桥等校机构的研究人员发表于《Nature》的最新研究揭示,使用合成数据训练AI模型可能导致模型性能退化,甚至“变傻”。该发现为AI领域敲响警钟,尤其针对依赖合成数据缓解数据短缺的科技公司。研究团队以Meta的OPT-125m模型为例,发现模型在连续微调过程中,回答准确性逐渐降低,直至开始生成逻辑混乱的回答。研究指出,模型崩溃主要由三种误差导致:统计近似误差、函数表达性误差及函数近似误差。此外,评估显示,微调设置下的语言模型在训练过程中会逐渐遗忘低概率事件,输出变得高度同质化。尽管已有技术尝试通过在训练数据中加入“水印”来解决此问题,但缺乏行业间协作使其商业应用受限。此发现强调了在AI训练过程中使用真实数据的重要性,尤其是对于那些依赖互联网数据进行模型训练的公司。未来,AI训练策略和数据使用规范需进一步优化,以避免模型性能退化。
原文链接
本文链接:https://kx.umi6.com/article/4099.html
转载请注明文章出处
相关推荐
换一换
AI 搜索“毒化”现实:模型崩溃隐忧,从神器到“垃圾输出”
2025-05-29 06:52:45
Nature封面:AI训AI,越训越傻
2024-07-27 12:59:34
“死亡互联网理论”刷屏硅谷
2025-10-20 07:59:52
AI生成的数据,竟成为一枚射向自己的子弹?
2024-12-02 19:57:32
AI 训 AI 遭投毒 9 次后大崩溃,牛津剑桥等发现登 Nature 封面
2024-07-25 18:27:09
Nature最新封面:AI 训练 AI?也许越来越笨
2024-07-25 09:03:21
研究:反复使用 AI 生成的内容来训练 AI 可造成“模型崩溃”
2024-09-05 08:13:11
AI训AI惨遭投毒9次大崩溃,牛津剑桥等惊天发现登Nature封面
2024-07-25 19:17:55
Meta削减人工智能部门约600个职位,精简架构以加速组织转型
2025-10-23 02:55:30
阿里回应“C计划”爆料 夸克上线对话助手挑战豆包 AI App下一步如何进化?
2025-10-23 14:06:33
田渊栋被裁后新offer排到法国!原来Llama 4.5训完后被卸磨杀驴了
2025-10-24 09:29:01
中信证券:新一代AIDC供配电架构 高功率时代加速渗透
2025-10-24 08:30:42
“超级周期”持续演绎 三星和SK海力士将内存价格上调30%
2025-10-23 13:08:10
489 文章
224064 浏览
24小时热文
更多
-
2025-10-24 09:34:47 -
2025-10-24 09:33:43 -
2025-10-24 09:32:35