标题:AI“规模暴力”真的失效了吗?
近期,关于Scaling Law的讨论不断。《The Information》文章指出,OpenAI的下一代旗舰模型Orion(或称GPT-5),在能力和成本方面未达到预期。Orion的代码能力甚至不如现有模型,且运行成本更高。为此,OpenAI不得不改变策略。
类似的情况也发生在Google和Anthropic。Google的Gemini模型未能达到预期,Anthropic暂停了Opus 3.5的开发。这引发了人们对Scaling Law是否失效的质疑。
Scaling Law,即尺度定律,由OpenAI在2020年提出,核心观点是模型性能与计算量、数据集大小和模型参数量存在幂律关系。若Scaling Law失效,意味着“更大更好”的理念可能不再适用。
正方观点认为Scaling Law神话终结。Ilya Sutskever表示,扩展训练结果趋于平稳,需寻找“正确”的规模。OpenAI和Google都在开发新技术以弥补传统训练方法的局限性。
反方观点则认为Scaling Law仍然有效。OpenAICEO Sam Altman表示,OpenAI将在今年晚些时候发布新版本。微软AI主管Mustafa Suleyman也认为规模仍是关键因素。微软CTO Kevin Scott、前谷歌CEO Eric Schmidt等也持相同观点。
此外,有研究提出新的精度缩放定律。哈佛大学等机构的研究表明,精度在模型扩展规律中更为重要。当模型规模固定时,需以更高精度进行训练,如16位。这可能导致从纯规模扩张向专用模型和人本应用的转变。
总之,尽管Scaling Law面临挑战,但仍有多种方法可提升模型性能。未来AI的发展仍充满希望。
原文链接
本文链接:https://kx.umi6.com/article/8930.html
转载请注明文章出处
相关推荐
.png)
换一换
毕马威报告:中国银行业在大模型落地应用方面走在前列
2025-06-23 16:27:32
阿里、智谱等扎堆发布大模型 编程、金融等方向成焦点
2025-07-30 20:55:52
31亿!我国大模型应用个人用户注册“爆表” 竟超全国人口规模2倍多
2025-07-31 12:06:11
硅基流动入驻阿里云云市场,核心 API 服务将全面接入百炼平台
2025-06-19 09:45:52
一场「狼人杀」,考倒了一堆大模型
2025-08-28 14:28:50
大模型又迎来重要玩家!美团首个开源大模型来了
2025-09-01 18:28:28
大模型首次直接理解代码图:不用 Agent 自动修 bug,登顶 SWE-Bench 开源模型榜单
2025-06-27 15:12:57
港股AGI第一股“云知声”首战告捷:大模型贡献1亿收入,单客价直线提升116.2%,AI保险业务暴涨1386.8%
2025-08-29 20:43:34
李飞飞的答案:大模型之后,Agent向何处去?
2025-09-05 09:13:59
推理成本骤降75%!gpt-oss用新数据类型实现4倍推理速度,80GB显卡能跑1200亿参数大模型
2025-08-11 16:04:21
特想聊聊快手这次的变化
2025-06-25 08:43:51
我国大模型数量超1500个
2025-07-27 23:04:18
1万tokens是检验长文本的新基准,超过后18款大模型集体失智
2025-07-17 15:23:24
534 文章
183484 浏览
24小时热文
更多

-
2025-09-06 16:37:17
-
2025-09-06 16:36:53
-
2025-09-06 16:36:08