标题:现在的大模型现状,就是豪赌
现在的大模型现状可以用一个词总结——豪赌。若能成功,未来前景广阔。
2023年,大模型强调Scaling Law;2024年,该理论面临挑战。2025年起,传统路径难以持续,需探索新方向。这条路充满不确定性和高成本,但潜力巨大。
去年我们假设有一条清晰的Scaling Law路径,但现在数据成为瓶颈,合成数据无法大幅提升知识广度,反哺Pre-train的路径停滞。
当前可能成功的Scaling Law在于O系列模型的Post-train阶段,通过RL让模型学会自主和自适应的COT。实现Self-play的RL,用算力换取数据,如AlphaZero通过自博弈超越人类水平。
然而,超大规模Self-play RL的效果尚未验证,Post-train RL泛化路径也未找到。目前最大的瓶颈是算力,需要大量算力进行实验以验证或证伪O系列的Scaling Law。
未来,头部大模型公司期待GB和NVL72的大集群,以指数级算力提升尝试Self-play RL。若成功,将开启新阶段;若失败,则可能遭遇重大挑战。
因此,这是一场豪赌,没有明确回报。前沿研究充满未知,但机遇往往诞生于高风险中。
原文链接
本文链接:https://kx.umi6.com/article/12106.html
转载请注明文章出处
相关推荐
换一换
字节对大模型方向加码期权激励 核心技术员工最高可获百万元
2025-09-03 15:50:37
一场「狼人杀」,考倒了一堆大模型
2025-08-28 14:28:50
GPT-5 没有惊喜,但信号拉满
2025-08-11 13:00:45
1300000000000000!谷歌每月Tokens消耗量曝光(别数了是千万亿)
2025-10-11 09:26:13
大模型产生幻觉,全怪人类PUA吗?
2025-09-10 15:36:03
数字人,正在逼近盈利线
2025-07-17 12:20:37
百度生成式AI和大模型专利中国第一,全栈创新驱动AI应用领先
2025-07-18 16:41:37
国产模型+国产芯片“蜜月期”开启!DeepSeek、智谱密集上新 华为、寒武纪芯片火速适配
2025-09-30 21:35:35
阿里字节腾讯,集体重仓新风口
2025-10-17 14:18:54
当AI智能体走进诊室,大模型如何颠覆医疗?
2025-07-30 13:48:25
人类正在被AI「幻觉」欺骗
2025-08-20 10:10:57
“雷军千万年薪要挖”的 DeepSeek 罗福莉官宣加入小米 Xiaomi MiMo 大模型团队
2025-11-12 14:05:32
IDC评测9家座舱大模型产品 斑马获最多项满分推荐
2025-07-18 11:36:59
588 文章
327477 浏览
24小时热文
更多
-
2025-12-08 09:22:21 -
2025-12-08 09:21:09 -
2025-12-08 09:20:01