标题:晶圆级芯片,是未来
如今,大模型的参数已达到“亿”级别,两年间计算需求激增1000倍,远超硬件发展速度。目前主流方案依赖GPU集群,但单芯片GPU存在物理尺寸限制和多芯片互联延迟问题,导致性能无法线性增长。面对万亿参数模型,即使堆叠数千块英伟达H100,也难逃算力不足、电费高昂的问题。
业内AI训练硬件分为两大阵营:采用晶圆级集成技术的专用加速器(如Cerebras WSE-3和特斯拉Dojo)和基于传统架构的GPU集群(如英伟达H100)。晶圆级芯片被视为突破方向,通过不切割晶圆,实现更高带宽和更低延迟,提升算力密度,缩小集群规模并降低功耗。
Cerebras WSE-3采用台积电5nm工艺,拥有4万亿晶体管,支持1.2PB片外内存,训练能力是H100的数百倍。特斯拉Dojo则通过Chiplet方式集成25颗D1芯粒,提供9Petaflops算力。两者均在特定场景下表现出色,但面临成本高、扩展性有限等问题。
相比而言,英伟达H100成本低,适合初期部署,但长期使用中能耗高、协作性能受限。晶圆级芯片虽成本高,但在超大规模AI模型训练中更具优势。未来,随着技术进步,晶圆级芯片或将成为算力发展的关键方向。
原文链接
本文链接:https://kx.umi6.com/article/20959.html
转载请注明文章出处
相关推荐
.png)
换一换
国内最早的AI大模型公司已经开始亏损了
2025-04-28 08:44:59
K时评:DeepSeek R2,翘首以盼
2025-08-19 21:06:04
豆包调用量飙升137倍 字节AI生态下一环是硬件?这些上市公司已打入供应链
2025-06-12 11:36:38
当智能变成平的
2025-02-28 09:02:36
全网都在等梁文锋
2025-04-30 19:53:07
钛媒体AGI独家
2025-02-19 19:54:56
蚂蚁自研2900亿大模型用国产AI芯片训练,计算成本508万元低于DeepSeek
2025-03-24 12:55:38
全国首个罕见病领域 AI 大模型“协和・太初”发布,可进一步缩短确诊时间
2025-02-20 15:17:38
一天内海外AI大模型接连上新 还有“重大发布”蓄势待发
2025-08-06 12:33:38
英伟达的最大空头出现了
2024-12-31 15:46:07
后DeepSeek时代:六小虎向左,BAT向右
2025-03-27 15:52:21
2年间AI大模型成本骤降万倍,商业化应用加速跑|智谱张帆@MEET2025
2024-12-27 09:54:24
DeepSeek劝不了谷歌们
2025-02-06 08:24:55
510 文章
173991 浏览
24小时热文
更多

-
2025-09-07 21:49:50
-
2025-09-07 20:50:36
-
2025-09-07 20:49:25