标题:AI“规模暴力”真的失效了吗?
近期,关于Scaling Law的讨论不断。《The Information》文章指出,OpenAI的下一代旗舰模型Orion(或称GPT-5),在能力和成本方面未达到预期。Orion的代码能力甚至不如现有模型,且运行成本更高。为此,OpenAI不得不改变策略。
类似的情况也发生在Google和Anthropic。Google的Gemini模型未能达到预期,Anthropic暂停了Opus 3.5的开发。这引发了人们对Scaling Law是否失效的质疑。
Scaling Law,即尺度定律,由OpenAI在2020年提出,核心观点是模型性能与计算量、数据集大小和模型参数量存在幂律关系。若Scaling Law失效,意味着“更大更好”的理念可能不再适用。
正方观点认为Scaling Law神话终结。Ilya Sutskever表示,扩展训练结果趋于平稳,需寻找“正确”的规模。OpenAI和Google都在开发新技术以弥补传统训练方法的局限性。
反方观点则认为Scaling Law仍然有效。OpenAICEO Sam Altman表示,OpenAI将在今年晚些时候发布新版本。微软AI主管Mustafa Suleyman也认为规模仍是关键因素。微软CTO Kevin Scott、前谷歌CEO Eric Schmidt等也持相同观点。
此外,有研究提出新的精度缩放定律。哈佛大学等机构的研究表明,精度在模型扩展规律中更为重要。当模型规模固定时,需以更高精度进行训练,如16位。这可能导致从纯规模扩张向专用模型和人本应用的转变。
总之,尽管Scaling Law面临挑战,但仍有多种方法可提升模型性能。未来AI的发展仍充满希望。
原文链接
本文链接:https://kx.umi6.com/article/8930.html
转载请注明文章出处
相关推荐
换一换
把枯燥的工作先扔给大模型?
2025-08-15 12:12:45
长三角一体化大模型发布 AI将为区域发展提供决策支撑
2026-01-12 09:40:07
GPT-5之后,奥特曼向左,梁文锋向右
2025-08-15 17:17:56
两部门:到2027年推动五个以上专业大模型在电网、发电、煤炭、油气等行业深度应用
2025-09-08 10:56:26
“雷军千万年薪要挖”的 DeepSeek 罗福莉官宣加入小米 Xiaomi MiMo 大模型团队
2025-11-12 14:05:32
杭州“十五五”规划建议:实施大模型前沿技术攻关和高端芯片、基础软件、模型算法等研发计划 建设人工智能开源社区
2026-01-16 11:34:57
大模型开始打王者荣耀了
2025-09-02 12:31:33
智谱AI,排名「第二」
2025-12-21 12:41:26
百度新设两个大模型研发部:直接向CEO李彦宏汇报!
2025-11-25 22:10:22
推理成本骤降75%!gpt-oss用新数据类型实现4倍推理速度,80GB显卡能跑1200亿参数大模型
2025-08-11 16:04:21
真正面向大模型的AI Infra,必须同时懂模型、系统、产业|商汤大装置宣善明@MEET2026
2025-12-22 10:35:49
上海:推动医疗器械相关垂类大模型研发应用
2025-09-15 16:02:14
OpenAI的命门,决定了大模型公司的未来
2025-09-03 14:48:12
707 文章
471401 浏览
24小时热文
更多
-
2026-01-23 21:15:09 -
2026-01-23 21:14:01 -
2026-01-23 20:15:45