1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:大模型自我提升后能力反降:LLaMA和Mistral受挫

研究发现,AI在常识理解、数学推理和代码生成等任务中,经历多轮自我提升后,可能出现“自我提升逆转”现象。即使如LLaMA-2-7B、Mistral-7B和LLaMA-8B这样的大模型,也可能遭遇能力倒退。这类似学生过度刷题导致实际解题能力下降,AI的回答可能变得模式化,失去创新和适应新情境的能力。

研究者通过“迭代后训练”方法,包括采样答案、构建训练集和模型后训练,观察了训练次数、模型基础能力等因素对AI学习的影响。虽然初始成绩提高,但深入分析揭示了“能力幻觉”(仅凭记忆而非理解)、回答多样性丧失和泛化能力减弱的问题。

尽管post-training自我提升有潜力,但AI的进化过程复杂,需关注其实际问题解决能力、创造力和适应性。上海交通大学GAIR实验室,专注于生成式人工智能研究,呼吁在追求性能提升的同时,全面审视AI的发展,以实现其真正价值。

原文链接
本文链接:https://kx.umi6.com/article/3657.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
大模型“自学”后能力反下降,Llama/Mistral都没逃过
2024-07-19 17:18:40
重庆“十五五”规划建议:建设“人工智能+”市域开源新生态 迭代完善人工智能政策体系
2025-12-08 08:18:03
Airwallex 空中云汇完成3.3 亿美元 G 轮融资,估值80 亿美元
2025-12-08 16:35:51
OpenAI、阿里、字节们的AI硬件战事:害怕错过下一代入口
2025-12-06 12:27:46
马斯克谈每年发射100万吨AI卫星:大规模运行AI最低成本方式
2025-12-08 10:20:50
谷歌 DeepMind CEO 哈萨比斯:规模定律是走向通用人工智能的关键
2025-12-08 09:16:34
设立河南首支AI基金,领投众擎赋能产业生态
2025-12-08 15:33:26
重庆“十五五”规划建议:支持领军企业牵头组建“人工智能+汽车”生态联盟 布局超快充、换电站、加氢站等设施网络
2025-12-08 08:16:57
英伟达巧用8B模型秒掉GPT-5,开源了
2025-12-06 14:32:11
“微软小冰之父”李笛再创业:押注“认知大模型”,奇绩参与投资
2025-12-08 22:51:57
微博CEO王高飞谈AI手机:发微博功能待确认 主流应用操作存限制
2025-12-08 16:38:11
端侧AI更安心!天玑9500强大双NPU:实现智能体验与隐私安全兼得
2025-12-08 11:25:48
智能体A2A落地华为新旗舰,鸿蒙开发者新机遇来了
2025-12-06 12:27:36
24小时热文
更多
扫一扫体验小程序