标题:300亿美元也难再造GPT-4?NUS尤洋解析AI增长瓶颈
正文:
ChatGPT发布三周年之际,“AI瓶颈期”的焦虑愈发凸显。新加坡国立大学校长青年教授、潞晨科技创始人尤洋提出一个关键问题:即便有300亿美元预算,我们能否训练出比GPT-4更强的模型?
在《智能增长的瓶颈》一文中,尤洋指出,当前AI发展的核心问题并非算力不足,而是现有技术范式难以高效利用持续增长的算力。他提出了几个颠覆性观点:
- 智能的本质是能源转化:过去十年,AI通过计算将电力转化为智能,但转化效率正面临挑战。
- Transformer的成功秘密:它并非更像人脑,而是一台“伪装成神经网络的并行计算机”,完美适配英伟达GPU的堆料逻辑。
- 效率不等于智能:新架构如Mamba虽提升了吞吐量,但在“算力转智能”的终极效率上未必超越Transformer。
- 未来出路:是否应抛弃Adam优化器?回归高精度计算(FP32/64)?
尤洋认为,智能的核心在于预测能力——即对未来状态进行稳定、可执行的判断。这一视角解释了为何Next-Token Prediction成为“智能发动机”,但也暴露了许多系统在真实场景中的短板。
文章进一步探讨了预训练、微调和强化学习的关系,指出三者本质上都是通过梯度更新参数,而预训练之所以贡献主要智能,是因为其消耗了最多的算力。然而,随着算力增长,现有范式对新增算力的吸收效率正在下降,通信与同步开销抵消了部分收益。
Transformer的成功不仅是算法胜利,更是模型架构与硬件体系高度匹配的结果。然而,当算力继续增长时,现有范式是否还能扩展?尤洋提出,真正的瓶颈在于算力与智能增长之间的映射关系开始松动。
未来可能的突破方向包括更高精度计算、更高效的优化器、更可扩展的架构或Loss函数等。尤洋强调,AI基础设施的核心目标应是提升并行计算体系的整体扩展性,而非仅关注单点性能。
结论是:只要能找到更高效组织计算的方式,智能的上限远未到来。但如何在极端算力条件下持续增强智能,仍是未解之谜。
原文链接:https://zhuanlan.zhihu.com/p/1989100535295538013
原文链接
本文链接:https://kx.umi6.com/article/30997.html
转载请注明文章出处
相关推荐
换一换
OpenAI 首席财务官:过去三年,公司收入、算力均累计增长约十倍
2026-01-19 16:03:05
CVPR 2026:深度学习的「标准件」,正在被逐个拆掉
2026-05-29 18:20:29
内蒙古:建设全国领先的绿色智能算力保障基地 持续提升智能算力规模
2026-04-08 19:08:30
华为徐直军:全球最强超节点今年四季度上市
2025-09-18 10:51:41
谷歌AI超级大饼:同成本下1000倍性能提升、每半年翻倍
2025-11-22 22:37:32
黄仁勋不信泡沫,OpenAI需要“印钞机”
2025-10-12 08:39:18
科技部部长阴和俊:强化算力、算法、数据等高效供给 全面实施人工智能+行动
2025-10-24 11:39:17
“不要对AI说谢谢”疯传 实测多个大模型:放心大胆用!
2026-02-10 06:57:58
马斯克22万张GPU全卖给Claude用:5小时限额翻倍,双方合作建太空算力
2026-05-07 10:09:02
硅谷巨头抱团押注AI算力,中国跟不跟?
2025-10-15 10:38:19
OpenAI总裁:今年预计在算力上花费500亿美元
2026-05-06 08:07:03
我们还是低估了英伟达
2025-09-17 21:39:00
Anthropic将向SpaceX支付近450亿美元以获取算力
2026-05-21 08:28:15
770 文章
686052 浏览
24小时热文
更多
-
2026-06-09 00:54:40 -
2026-06-09 00:53:08 -
2026-06-08 23:49:41