标题:晶圆级芯片,是未来
如今,大模型的参数已达到“亿”级别,两年间计算需求激增1000倍,远超硬件发展速度。目前主流方案依赖GPU集群,但单芯片GPU存在物理尺寸限制和多芯片互联延迟问题,导致性能无法线性增长。面对万亿参数模型,即使堆叠数千块英伟达H100,也难逃算力不足、电费高昂的问题。
业内AI训练硬件分为两大阵营:采用晶圆级集成技术的专用加速器(如Cerebras WSE-3和特斯拉Dojo)和基于传统架构的GPU集群(如英伟达H100)。晶圆级芯片被视为突破方向,通过不切割晶圆,实现更高带宽和更低延迟,提升算力密度,缩小集群规模并降低功耗。
Cerebras WSE-3采用台积电5nm工艺,拥有4万亿晶体管,支持1.2PB片外内存,训练能力是H100的数百倍。特斯拉Dojo则通过Chiplet方式集成25颗D1芯粒,提供9Petaflops算力。两者均在特定场景下表现出色,但面临成本高、扩展性有限等问题。
相比而言,英伟达H100成本低,适合初期部署,但长期使用中能耗高、协作性能受限。晶圆级芯片虽成本高,但在超大规模AI模型训练中更具优势。未来,随着技术进步,晶圆级芯片或将成为算力发展的关键方向。
原文链接
本文链接:https://kx.umi6.com/article/20959.html
转载请注明文章出处
相关推荐
换一换
我国水利标准 AI 大模型正式发布,采用海量知识库 + DeepSeek / Qwen 双模型
2025-06-03 10:52:19
看完清北看浙大,DeepSeek 宝典一网打尽(附 12 部全集下载)
2025-03-05 20:19:43
对话宇树科技王兴兴:人形机器人,没有大家想象的那么复杂
2025-02-18 17:21:59
国产 AI 大模型加速迭代,厂商迈向开源、集聚化
2025-02-23 22:06:26
DeepSeek劝不了谷歌们
2025-02-06 08:24:55
卢伟冰回应罗福莉加入小米及未来 AI 新战略:不能透露太多,但小米在大模型应用方面进展远超预期
2025-12-04 11:14:44
华为杨超斌:近 8 个月,国内 AI 大模型 Token 所带来的流量增长了 33 倍
2025-03-04 20:33:25
苹果最新研究:现有 AI 大模型“更像是在记忆,而非真正的推理”
2025-06-08 17:10:55
AI大模型上天了!中国科学院全新研究成果打破美国太空技术领先地位
2025-05-12 13:33:12
GPT-5来了,Kimi却掉队了
2025-08-12 15:22:00
「六小虎」战局再生变,杭州国资出手投了智谱
2025-03-03 13:18:17
斯坦福研究:去年全球英语文稿中 24% 企业新闻稿、18% 消费者投诉内容由 AI 大模型产出
2025-10-07 09:47:51
全球首个体重管理 AI 大模型“减单”在合肥发布
2025-03-24 08:47:05
624 文章
361650 浏览
24小时热文
更多
-
2025-12-08 23:53:52 -
2025-12-08 22:52:38 -
2025-12-08 22:51:57