1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

近日,有外媒报道,OpenAI 正在调整策略应对大模型改进速度放缓的问题。知名认知科学家Gary Marcus称,GPT正进入收益递减期。不仅仅是GPT,其他大模型也面临类似困境。

OpenAI 的新模型Orion在完成20%的训练后便达到GPT-4的水平,但整体提升幅度不如从前。这意味着GPT升级速度在减缓。此外,Orion在某些领域(如编码)的表现未必优于前代模型。OpenAI表示今年没有发布Orion的计划。

改进放缓的原因之一是可用预训练数据的减少。高质量训练数据变得稀缺,网站、书籍等公开文本已被耗尽。为应对这一问题,OpenAI成立基础团队,研究如何在数据有限的情况下改进模型。新策略包括利用AI生成的合成数据训练模型,以及在后期训练中进一步优化。

类似困境也出现在其他前沿实验室。有数据显示,一些实验室通过增加训练时间和数据量来寻求突破,但成效有限。数据质量成为关键,这需要时间积累。

麻省理工学院的研究表明,大模型虽然输出令人印象深刻,但缺乏连贯的世界理解能力。一旦任务环境变化,模型表现可能大幅下降。例如,在导航任务中,封闭部分街道会导致模型性能显著下降。

面对这些瓶颈,有人建议将LLM与Cyc(一个逻辑引擎和常识规则数据库)结合,以增强模型的理解能力。还有观点认为,人形机器人在现实世界中的数据可能对模型改进更有帮助。

总之,大模型改进速度放缓,需要新的方法和技术来突破现有局限。

原文链接
本文链接:https://kx.umi6.com/article/8574.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
几乎都在挂羊头卖狗肉!AI Agent泡沫实在太大了
2025-10-20 11:04:42
全球首份大模型业绩报!MiniMax预判2026三大超级PMF,AI平台公司启程了
2026-03-03 11:54:49
Manus救不了Meta
2026-01-08 20:35:12
真正面向大模型的AI Infra,必须同时懂模型、系统、产业|商汤大装置宣善明@MEET2026
2025-12-22 10:35:49
腾讯AI下了一场「及时雨」
2025-12-19 10:42:16
杨植麟当主持人的大模型圆桌:张鹏罗福莉夏立雪都放开说了
2026-03-27 23:23:11
阿里巴巴CEO吴泳铭:大模型是下一代操作系统 AI Cloud是下一代计算机
2025-09-24 10:37:04
亚马逊云科技发布多款大模型
2025-12-03 14:25:54
备案平均时长缩至2个月 目前已有216款大模型在京完成备案
2026-02-28 19:46:01
从 CIPS & CLM 迈进:中国大模型的智能跃迁
2025-10-30 17:51:34
阿里千问大模型换将,32岁林俊旸官宣告别
2026-03-04 10:27:38
智谱首份业绩报告:商业化全面爆发,Maas平台ARR达17亿元提升60倍
2026-03-31 18:02:15
字节对大模型方向加码期权激励 核心技术员工最高可获百万元
2025-09-03 15:50:37
24小时热文
更多
扫一扫体验小程序