1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:大模型自我提升后能力反降:LLaMA和Mistral受挫

研究发现,AI在常识理解、数学推理和代码生成等任务中,经历多轮自我提升后,可能出现“自我提升逆转”现象。即使如LLaMA-2-7B、Mistral-7B和LLaMA-8B这样的大模型,也可能遭遇能力倒退。这类似学生过度刷题导致实际解题能力下降,AI的回答可能变得模式化,失去创新和适应新情境的能力。

研究者通过“迭代后训练”方法,包括采样答案、构建训练集和模型后训练,观察了训练次数、模型基础能力等因素对AI学习的影响。虽然初始成绩提高,但深入分析揭示了“能力幻觉”(仅凭记忆而非理解)、回答多样性丧失和泛化能力减弱的问题。

尽管post-training自我提升有潜力,但AI的进化过程复杂,需关注其实际问题解决能力、创造力和适应性。上海交通大学GAIR实验室,专注于生成式人工智能研究,呼吁在追求性能提升的同时,全面审视AI的发展,以实现其真正价值。

原文链接
本文链接:https://kx.umi6.com/article/3657.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
大模型“自学”后能力反下降,Llama/Mistral都没逃过
2024-07-19 17:18:40
只有0.9B的PaddleOCR-VL,却是现在最强的OCR模型
2025-10-24 16:47:14
SEE Conf 2025:开启体验科技的新十年
2025-10-24 17:46:00
BBC 等机构研究评估 AI 工具新闻总结水平,谷歌 Gemini 错误比例最高
2025-10-24 08:27:09
网易云信10周年宣布品牌升级,从“基础通信管道”到“AI交互引擎”
2025-10-23 15:10:38
100 万块 TPU、1GW 容量,Anthropic 与谷歌云正式达成百亿美元算力合作
2025-10-24 10:33:37
荣耀设立20亿激励资源 提升智能体和MagicOS生态体验力度
2025-10-23 18:14:34
六大AI实盘交易追踪:中国模型收益领跑,GPT本金亏到不足三成
2025-10-23 18:12:20
“996”算偷懒 硅谷AI精英每周狂干100小时!
2025-10-24 12:38:25
与 OpenAI“划清界限”,微软 AI 负责人苏莱曼称不会推出“成人模式”
2025-10-24 12:37:06
OpenAI收购macOS供应商,剑指GPT操作系统!微软也不装了
2025-10-24 14:39:11
存储芯片“超级周期”持续演绎:三星、SK海力士料将涨价30% 客户开启囤货模式
2025-10-23 15:11:46
OPPO与蚂蚁集团签署战略合作 将共建AI智能体等
2025-10-24 12:40:26
24小时热文
更多
扫一扫体验小程序