1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

近日,有外媒报道,OpenAI 正在调整策略应对大模型改进速度放缓的问题。知名认知科学家Gary Marcus称,GPT正进入收益递减期。不仅仅是GPT,其他大模型也面临类似困境。

OpenAI 的新模型Orion在完成20%的训练后便达到GPT-4的水平,但整体提升幅度不如从前。这意味着GPT升级速度在减缓。此外,Orion在某些领域(如编码)的表现未必优于前代模型。OpenAI表示今年没有发布Orion的计划。

改进放缓的原因之一是可用预训练数据的减少。高质量训练数据变得稀缺,网站、书籍等公开文本已被耗尽。为应对这一问题,OpenAI成立基础团队,研究如何在数据有限的情况下改进模型。新策略包括利用AI生成的合成数据训练模型,以及在后期训练中进一步优化。

类似困境也出现在其他前沿实验室。有数据显示,一些实验室通过增加训练时间和数据量来寻求突破,但成效有限。数据质量成为关键,这需要时间积累。

麻省理工学院的研究表明,大模型虽然输出令人印象深刻,但缺乏连贯的世界理解能力。一旦任务环境变化,模型表现可能大幅下降。例如,在导航任务中,封闭部分街道会导致模型性能显著下降。

面对这些瓶颈,有人建议将LLM与Cyc(一个逻辑引擎和常识规则数据库)结合,以增强模型的理解能力。还有观点认为,人形机器人在现实世界中的数据可能对模型改进更有帮助。

总之,大模型改进速度放缓,需要新的方法和技术来突破现有局限。

原文链接
本文链接:https://kx.umi6.com/article/8574.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
几乎都在挂羊头卖狗肉!AI Agent泡沫实在太大了
2025-10-20 11:04:42
火线解析智谱AI招股书:年营收3亿增速130%,率先冲刺全球大模型第一股
2025-12-19 23:14:23
字节对大模型方向加码期权激励 核心技术员工最高可获百万元
2025-09-03 15:50:37
Manus救不了Meta
2026-01-08 20:35:12
阶跃星辰杀入季后赛,强势跻身AI“新六小虎”第一梯队
2026-02-27 15:48:37
我国大模型密集落地 新技术加速普惠应用
2026-02-14 12:17:30
李开复任命三位新高管:零一万物的“一把手工程”与大模型中场战事
2025-10-27 13:00:52
备案平均时长缩至2个月 目前已有216款大模型在京完成备案
2026-02-28 19:46:01
花3000元让AI改口,大模型的尽头是广告?
2026-01-06 19:29:29
把12个AI凑到一起打工,它们竟然搞起“小团体”?
2025-10-16 22:02:39
百度新设两个大模型研发部:直接向CEO李彦宏汇报!
2025-11-25 22:10:22
月之暗面近20天收入超去年全年
2026-02-23 19:11:04
“雷军千万年薪要挖”的 DeepSeek 罗福莉官宣加入小米 Xiaomi MiMo 大模型团队
2025-11-12 14:05:32
24小时热文
更多
扫一扫体验小程序