近日,有外媒报道,OpenAI 正在调整策略应对大模型改进速度放缓的问题。知名认知科学家Gary Marcus称,GPT正进入收益递减期。不仅仅是GPT,其他大模型也面临类似困境。
OpenAI 的新模型Orion在完成20%的训练后便达到GPT-4的水平,但整体提升幅度不如从前。这意味着GPT升级速度在减缓。此外,Orion在某些领域(如编码)的表现未必优于前代模型。OpenAI表示今年没有发布Orion的计划。
改进放缓的原因之一是可用预训练数据的减少。高质量训练数据变得稀缺,网站、书籍等公开文本已被耗尽。为应对这一问题,OpenAI成立基础团队,研究如何在数据有限的情况下改进模型。新策略包括利用AI生成的合成数据训练模型,以及在后期训练中进一步优化。
类似困境也出现在其他前沿实验室。有数据显示,一些实验室通过增加训练时间和数据量来寻求突破,但成效有限。数据质量成为关键,这需要时间积累。
麻省理工学院的研究表明,大模型虽然输出令人印象深刻,但缺乏连贯的世界理解能力。一旦任务环境变化,模型表现可能大幅下降。例如,在导航任务中,封闭部分街道会导致模型性能显著下降。
面对这些瓶颈,有人建议将LLM与Cyc(一个逻辑引擎和常识规则数据库)结合,以增强模型的理解能力。还有观点认为,人形机器人在现实世界中的数据可能对模型改进更有帮助。
总之,大模型改进速度放缓,需要新的方法和技术来突破现有局限。
原文链接
本文链接:https://kx.umi6.com/article/8574.html
转载请注明文章出处
相关推荐
换一换
顶尖技术+标准产品+创新模式+可靠服务,打造大模型商业落地中国范式
2025-12-16 10:32:22
潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026
2025-12-22 10:34:39
阿里字节腾讯,集体重仓新风口
2025-10-17 14:18:54
智谱上市后首份财报:超7.24亿元!国内收入最高大模型公司,MaaS发力了
2026-03-31 21:04:07
真正面向大模型的AI Infra,必须同时懂模型、系统、产业|商汤大装置宣善明@MEET2026
2025-12-22 10:35:49
“雷军千万年薪要挖”的 DeepSeek 罗福莉官宣加入小米 Xiaomi MiMo 大模型团队
2025-11-12 14:05:32
中金:2026年大模型在强化学习、模型记忆、上下文工程等方面将取得更多突破
2026-02-05 08:39:59
上海:推动医疗器械相关垂类大模型研发应用
2025-09-15 16:02:14
美团内测万亿级新一代大模型,全程基于国产算力集群训练
2026-04-24 12:12:33
长三角一体化大模型发布 AI将为区域发展提供决策支撑
2026-01-12 09:40:07
李开复任命三位新高管:零一万物的“一把手工程”与大模型中场战事
2025-10-27 13:00:52
中国中文信息学会2025学术年会暨第二届中国大模型大会(CIPS & CLM 2025)于10月28日在北京盛大开幕
2025-10-30 18:52:50
舔狗AI和被预约的寿司郎
2026-06-05 00:34:31
694 文章
615416 浏览
24小时热文
更多
-
2026-06-09 00:54:40 -
2026-06-09 00:53:08 -
2026-06-08 23:49:41