1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:大模型自我提升后能力反降:LLaMA和Mistral受挫

研究发现,AI在常识理解、数学推理和代码生成等任务中,经历多轮自我提升后,可能出现“自我提升逆转”现象。即使如LLaMA-2-7B、Mistral-7B和LLaMA-8B这样的大模型,也可能遭遇能力倒退。这类似学生过度刷题导致实际解题能力下降,AI的回答可能变得模式化,失去创新和适应新情境的能力。

研究者通过“迭代后训练”方法,包括采样答案、构建训练集和模型后训练,观察了训练次数、模型基础能力等因素对AI学习的影响。虽然初始成绩提高,但深入分析揭示了“能力幻觉”(仅凭记忆而非理解)、回答多样性丧失和泛化能力减弱的问题。

尽管post-training自我提升有潜力,但AI的进化过程复杂,需关注其实际问题解决能力、创造力和适应性。上海交通大学GAIR实验室,专注于生成式人工智能研究,呼吁在追求性能提升的同时,全面审视AI的发展,以实现其真正价值。

原文链接
本文链接:https://kx.umi6.com/article/3657.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
大模型“自学”后能力反下降,Llama/Mistral都没逃过
2024-07-19 17:18:40
阿莱德:目前公司仅有极个别订单最终交货地位于迪拜 涉及订单金额占公司整体营收比例不足1%
2026-03-06 11:58:07
鹅厂门口爆满了!腾讯工程师在总部楼下免费安装OpenClaw
2026-03-06 15:12:11
科研AI出了个狠角色:开源30B小模型,硬刚Gemini和Claude
2026-03-09 12:34:15
无锡高新区发布“养龙虾”12条 最高补贴500万
2026-03-09 14:47:52
龙虾最大痛点被官方插件升级!对话永不忘记,GPT和Gemini最强模型都可接入
2026-03-09 13:43:10
国产AI短剧《霍去病》火到海外 播放量超5亿!3000元成本、3人团队5天产出80集
2026-03-06 17:20:41
脉脉:AI岗位量暴涨12倍 平均月薪超6万元领跑春招市场
2026-03-09 19:05:07
和别人用一样的“提示词”生成相同的AI作品 算不算侵权?法院判了
2026-03-09 16:55:46
上海人工智能实验室推出DeepLink多元算力混合推理加速方案
2026-03-09 15:53:40
2026全球开发者先锋大会将于3月27日至29日在上海举办
2026-03-06 21:38:24
阿里否认大模型团队集体离职:团队稳定 服务正常
2026-03-05 21:58:59
首个物理AI数据基座平台“无垠”落户浙江,专治机器人数据荒,家庭工业商业场景全覆盖
2026-03-09 19:00:56
24小时热文
更多
扫一扫体验小程序