标题:AI“规模暴力”真的失效了吗?
近期,关于Scaling Law的讨论不断。《The Information》文章指出,OpenAI的下一代旗舰模型Orion(或称GPT-5),在能力和成本方面未达到预期。Orion的代码能力甚至不如现有模型,且运行成本更高。为此,OpenAI不得不改变策略。
类似的情况也发生在Google和Anthropic。Google的Gemini模型未能达到预期,Anthropic暂停了Opus 3.5的开发。这引发了人们对Scaling Law是否失效的质疑。
Scaling Law,即尺度定律,由OpenAI在2020年提出,核心观点是模型性能与计算量、数据集大小和模型参数量存在幂律关系。若Scaling Law失效,意味着“更大更好”的理念可能不再适用。
正方观点认为Scaling Law神话终结。Ilya Sutskever表示,扩展训练结果趋于平稳,需寻找“正确”的规模。OpenAI和Google都在开发新技术以弥补传统训练方法的局限性。
反方观点则认为Scaling Law仍然有效。OpenAICEO Sam Altman表示,OpenAI将在今年晚些时候发布新版本。微软AI主管Mustafa Suleyman也认为规模仍是关键因素。微软CTO Kevin Scott、前谷歌CEO Eric Schmidt等也持相同观点。
此外,有研究提出新的精度缩放定律。哈佛大学等机构的研究表明,精度在模型扩展规律中更为重要。当模型规模固定时,需以更高精度进行训练,如16位。这可能导致从纯规模扩张向专用模型和人本应用的转变。
总之,尽管Scaling Law面临挑战,但仍有多种方法可提升模型性能。未来AI的发展仍充满希望。
原文链接
本文链接:https://kx.umi6.com/article/8930.html
转载请注明文章出处
相关推荐
换一换
大模型自信心崩塌!谷歌DeepMind证实:反对意见让GPT-4o轻易放弃正确答案
2025-07-20 16:05:44
华泰证券:长期看好AI算力需求的持续增长
2025-07-28 08:07:00
人民呼唤DeepSeek!
2025-07-16 12:02:16
训练大模型烧了那么多钱,商业价值到底在哪?
2025-07-04 09:39:31
GPT-5之后,奥特曼向左,梁文锋向右
2025-08-15 17:17:56
我国大模型数量超1500个
2025-07-27 23:04:18
李飞飞的答案:大模型之后,Agent向何处去?
2025-09-05 09:13:59
DeepSeek V3.2、GLM4.6等大模型即将发布
2025-09-29 17:14:30
「今年业务是去年5倍以上」,工业智能体掀热潮
2025-08-29 12:38:30
百度生成式AI和大模型专利中国第一,全栈创新驱动AI应用领先
2025-07-18 16:41:37
卖酒的茅台要学AI了!和奔驰麦当劳一起拜师百度
2025-08-17 12:35:45
大模型隐私安全和公平性有“跷跷板”效应,最佳平衡法则刚刚找到
2025-07-27 21:02:57
大模型产生幻觉 全怪人类PUA吗
2025-09-12 01:04:40
595 文章
284960 浏览
24小时热文
更多
-
2025-10-25 18:38:20 -
2025-10-25 18:37:15 -
2025-10-25 16:32:54