1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

近日,有外媒报道,OpenAI 正在调整策略应对大模型改进速度放缓的问题。知名认知科学家Gary Marcus称,GPT正进入收益递减期。不仅仅是GPT,其他大模型也面临类似困境。

OpenAI 的新模型Orion在完成20%的训练后便达到GPT-4的水平,但整体提升幅度不如从前。这意味着GPT升级速度在减缓。此外,Orion在某些领域(如编码)的表现未必优于前代模型。OpenAI表示今年没有发布Orion的计划。

改进放缓的原因之一是可用预训练数据的减少。高质量训练数据变得稀缺,网站、书籍等公开文本已被耗尽。为应对这一问题,OpenAI成立基础团队,研究如何在数据有限的情况下改进模型。新策略包括利用AI生成的合成数据训练模型,以及在后期训练中进一步优化。

类似困境也出现在其他前沿实验室。有数据显示,一些实验室通过增加训练时间和数据量来寻求突破,但成效有限。数据质量成为关键,这需要时间积累。

麻省理工学院的研究表明,大模型虽然输出令人印象深刻,但缺乏连贯的世界理解能力。一旦任务环境变化,模型表现可能大幅下降。例如,在导航任务中,封闭部分街道会导致模型性能显著下降。

面对这些瓶颈,有人建议将LLM与Cyc(一个逻辑引擎和常识规则数据库)结合,以增强模型的理解能力。还有观点认为,人形机器人在现实世界中的数据可能对模型改进更有帮助。

总之,大模型改进速度放缓,需要新的方法和技术来突破现有局限。

原文链接
本文链接:https://kx.umi6.com/article/8574.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
马斯克Grok-4碾压所有大模型!“比所有博士聪明”,AIME25拿满分
2025-07-10 16:23:20
字节&MAP重塑大模型推理算法优化重点,强化学习重在高效探索助力LLM提升上限
2025-08-11 10:59:04
大模型低调出展,机器人各出奇招
2025-07-26 22:49:04
我国首个发电行业大模型“擎源”发布,模型参数达千亿级别
2025-06-28 20:23:24
大模型隐私安全和公平性有“跷跷板”效应,最佳平衡法则刚刚找到 | 人大&上海AI Lab
2025-07-28 09:07:15
AI玩具有多火?连马斯克都入场了
2025-07-29 21:36:44
大模型又迎来重要玩家!美团首个开源大模型来了
2025-09-01 18:28:28
高性能计算群星闪耀时
2025-08-21 12:35:24
把12个AI凑到一起打工,它们竟然搞起“小团体”?
2025-10-16 22:02:39
我国大模型数量超1500个
2025-07-27 23:04:18
对话中国信通院魏凯:AI下半场,大模型要少说话,多做事
2025-07-01 08:51:07
李飞飞的答案:大模型之后,Agent向何处去?
2025-09-05 09:13:59
中国企业调用大模型日均超10万亿Tokens
2025-09-01 12:17:48
24小时热文
更多
扫一扫体验小程序