标题:大模型自我提升后能力反降:LLaMA和Mistral受挫
研究发现,AI在常识理解、数学推理和代码生成等任务中,经历多轮自我提升后,可能出现“自我提升逆转”现象。即使如LLaMA-2-7B、Mistral-7B和LLaMA-8B这样的大模型,也可能遭遇能力倒退。这类似学生过度刷题导致实际解题能力下降,AI的回答可能变得模式化,失去创新和适应新情境的能力。
研究者通过“迭代后训练”方法,包括采样答案、构建训练集和模型后训练,观察了训练次数、模型基础能力等因素对AI学习的影响。虽然初始成绩提高,但深入分析揭示了“能力幻觉”(仅凭记忆而非理解)、回答多样性丧失和泛化能力减弱的问题。
尽管post-training自我提升有潜力,但AI的进化过程复杂,需关注其实际问题解决能力、创造力和适应性。上海交通大学GAIR实验室,专注于生成式人工智能研究,呼吁在追求性能提升的同时,全面审视AI的发展,以实现其真正价值。
原文链接
本文链接:https://kx.umi6.com/article/3657.html
转载请注明文章出处
相关推荐
.png)
换一换
大模型“自学”后能力反下降,Llama/Mistral都没逃过
2024-07-19 17:18:40
中盐集团与中国移动签署战略合作协议
2025-09-05 11:18:12
博通公司股价盘初大涨15%市值增长2200亿美元 多家机构集体上调其目标价
2025-09-05 22:27:31
视频理解新标杆,快手多模态推理模型开源:128k上下文+0.1秒级视频定位+跨模态推理
2025-09-05 22:26:24
通义千问系列最强大的语言模型:Qwen3-Max-Preview 上线
2025-09-06 00:26:52
Anthropic停服 智谱回应推出“Claude API 用户特别搬家计划”
2025-09-05 19:25:32
一场会议聊透具身智能:模型、数据、场景,我们梳理出了关键洞察
2025-09-05 10:21:32
马斯克,有望成万亿美元巨富
2025-09-05 22:27:21
AI生成苹果Metal内核,PyTorch推理速度提升87%
2025-09-05 11:17:03
拜拜Claude!阿里最强万亿模型编程秒了Opus4,实测在此
2025-09-06 12:37:03
全球第四大独角兽出现,创业公司要退场吗?
2025-09-07 16:47:03
AI 的下一个战场:小模型崛起
2025-09-05 21:26:34
AI“P 图”爆火出圈:“Nano Banana”一周为谷歌 Gemini 吸引千万新用户
2025-09-05 08:12:32
480 文章
179694 浏览
24小时热文
更多

-
2025-09-07 21:49:50
-
2025-09-07 20:50:36
-
2025-09-07 20:49:25