标题:现在的大模型现状,就是豪赌
现在的大模型现状可以用一个词总结——豪赌。若能成功,未来前景广阔。
2023年,大模型强调Scaling Law;2024年,该理论面临挑战。2025年起,传统路径难以持续,需探索新方向。这条路充满不确定性和高成本,但潜力巨大。
去年我们假设有一条清晰的Scaling Law路径,但现在数据成为瓶颈,合成数据无法大幅提升知识广度,反哺Pre-train的路径停滞。
当前可能成功的Scaling Law在于O系列模型的Post-train阶段,通过RL让模型学会自主和自适应的COT。实现Self-play的RL,用算力换取数据,如AlphaZero通过自博弈超越人类水平。
然而,超大规模Self-play RL的效果尚未验证,Post-train RL泛化路径也未找到。目前最大的瓶颈是算力,需要大量算力进行实验以验证或证伪O系列的Scaling Law。
未来,头部大模型公司期待GB和NVL72的大集群,以指数级算力提升尝试Self-play RL。若成功,将开启新阶段;若失败,则可能遭遇重大挑战。
因此,这是一场豪赌,没有明确回报。前沿研究充满未知,但机遇往往诞生于高风险中。
原文链接
本文链接:https://kx.umi6.com/article/12106.html
转载请注明文章出处
相关推荐
换一换
真正的AI竞争力,藏在大模型“后训练”这一步
2025-10-13 16:59:55
华泰证券:长期看好AI算力需求的持续增长
2025-07-28 08:07:00
卖酒的茅台要学AI了!和奔驰麦当劳一起拜师百度
2025-08-17 12:35:45
几乎都在挂羊头卖狗肉!AI Agent泡沫实在太大了
2025-10-20 11:04:42
开源模型TOP5,被中国厂商包圆了
2025-10-15 17:36:49
1万tokens是检验长文本的新基准,超过后18款大模型集体失智
2025-07-17 15:23:24
你用的大模型是什么MBTI?
2025-09-23 20:23:14
字节对大模型方向加码期权激励 核心技术员工最高可获百万元
2025-09-03 15:50:37
人类正在被AI「幻觉」欺骗
2025-08-20 10:10:57
DeepSeek删豆包冲上热搜,大模型世子之争演都不演了
2025-08-21 13:31:42
大模型自信心崩塌!谷歌DeepMind证实:反对意见让GPT-4o轻易放弃正确答案
2025-07-20 16:05:44
推理成本骤降75%!gpt-oss用新数据类型实现4倍推理速度,80GB显卡能跑1200亿参数大模型
2025-08-11 16:04:21
百度世界2025将于11月13日在北京举办
2025-10-13 20:03:11
547 文章
249802 浏览
24小时热文
更多
-
2025-10-23 11:04:07 -
2025-10-23 11:03:14 -
2025-10-23 11:03:01