标题:大模型自我提升后能力反降:LLaMA和Mistral受挫
研究发现,AI在常识理解、数学推理和代码生成等任务中,经历多轮自我提升后,可能出现“自我提升逆转”现象。即使如LLaMA-2-7B、Mistral-7B和LLaMA-8B这样的大模型,也可能遭遇能力倒退。这类似学生过度刷题导致实际解题能力下降,AI的回答可能变得模式化,失去创新和适应新情境的能力。
研究者通过“迭代后训练”方法,包括采样答案、构建训练集和模型后训练,观察了训练次数、模型基础能力等因素对AI学习的影响。虽然初始成绩提高,但深入分析揭示了“能力幻觉”(仅凭记忆而非理解)、回答多样性丧失和泛化能力减弱的问题。
尽管post-training自我提升有潜力,但AI的进化过程复杂,需关注其实际问题解决能力、创造力和适应性。上海交通大学GAIR实验室,专注于生成式人工智能研究,呼吁在追求性能提升的同时,全面审视AI的发展,以实现其真正价值。
原文链接
本文链接:https://kx.umi6.com/article/3657.html
转载请注明文章出处
相关推荐
换一换
大模型“自学”后能力反下降,Llama/Mistral都没逃过
2024-07-19 17:18:40
阿联酋人工智能公司G42:未来几年内将数据中心总容量提升至5吉瓦
2026-01-21 17:23:33
全球消费,进入「中国定义」时间
2026-01-22 13:54:12
xAI工程师播客聊太嗨,马斯克解雇了他
2026-01-21 18:20:58
卢宗青团队新作:人类先验打底,统一动作对齐,通用机器人模型正在落地
2026-01-22 17:03:53
农业农村部:将持续推动人工智能等在农业领域应用
2026-01-22 11:51:14
高通砸钱、雷军入股!刚刚,上海诞生一个183亿手机代工巨头
2026-01-22 18:04:11
日本人工智能创企Sakana AI宣布获谷歌投资
2026-01-23 16:04:10
超过三分之二的投资管理机构将AI广泛应用于前台业务支持
2026-01-21 19:23:09
欧盟提出《数字网络法案》拟统一网络连接规则
2026-01-21 19:24:13
昇腾云客户2663家,华为云稳居最大国产AI云服务提供商
2026-01-22 17:01:32
纳德拉达沃斯警示:没电,AI全是空谈
2026-01-22 04:36:47
重思启动重塑,美通社成功举办2026新传播年度论坛
2026-01-22 13:58:50
625 文章
423314 浏览
24小时热文
更多
-
2026-01-23 18:11:40 -
2026-01-23 18:10:36 -
2026-01-23 18:09:30