标题:一颗芯片带来的焦虑
英伟达今年面临诸多挑战,尤其是其Blackwell GPU。起初,有消息称该款GPU存在设计缺陷,影响了量产进度。尽管英伟达CEO黄仁勋强调问题已解决,但新的问题接踵而至。据报道,Blackwell GPU在高容量服务器机架中遇到过热问题,这导致了设计修改和延迟,影响了其交付时间。
过热问题迫使英伟达多次重新评估服务器机架设计。客户担心这些问题会阻碍新处理器在数据中心的部署。英伟达已指示供应商对机架进行多项设计修改以解决过热问题,尽管这些调整增加了延迟,但公司仍与云服务提供商和供应商密切合作,以确保最终产品的性能和可靠性。
Blackwell GPU的量产进度一拖再拖,直到10月底才进入量产阶段,预计明年1月底开始发货。过热问题已成为英伟达面临的主要挑战之一,涉及芯片、LSI桥、中介层和主板基板之间的热膨胀特性不匹配。为了解决这个问题,英伟达对GPU芯片的顶部金属层和焊点结构进行了修改。
过热问题不仅限于Blackwell GPU,此前英伟达准备使用的HBM也传出过热问题,直到几个月后才解决。过热问题不仅影响了芯片性能,还可能导致组件损坏。半导体分析公司Semianalysis的首席分析师表示,散热将是未来芯片设计的关键关注点。
大型数据中心需要液冷来解决散热问题,以避免早期失效和停机时间,从而影响总拥有成本。Meta已重新设计数据中心以适应未来的散热需求。尽管液冷面临工程和运营挑战,但英伟达已提出一种结合液体冷却和浸没式冷却的解决方案,以降低数据中心冷却所消耗的电力。
英伟达正在与多家公司合作,包括BOYD Corp、Durbin Group、Honeywell和Vertiv,以推进这种双温区冷却系统。英特尔也在开发类似的系统,但财务困境导致了一些项目受阻。
原文链接
本文链接:https://kx.umi6.com/article/9536.html
转载请注明文章出处
相关推荐
.png)
换一换
TrendForce:英伟达H20出口解禁助力需求释放 预估中国外购AI芯片比例将回升至49%
2025-07-16 18:09:59
英伟达CFO:预计到本世纪末 人工智能基础设施支出将达到3万亿至4万亿美元
2025-08-28 06:11:45
英伟达:弥补弱点,乘上人工智能热潮
2025-09-02 12:32:42
华尔街缘何愈发看涨英伟达?除AI需求“爆棚”外,还与中国市场有关
2025-08-19 16:11:00
黄仁勋:中国的AI市场无论有没有英伟达都会进步 与华为是竞争对手不是敌人
2025-07-21 05:12:10
英伟达财报未超预期,最强AI芯片要推中国特供版?
2025-08-28 16:27:29
英伟达Q2创纪录,股价却跌了
2025-08-28 10:14:27
英伟达为机器人推出懂推理的“大脑”!升级版Cosmos世界模型来了
2025-08-12 17:20:07
分析师:台积电二季度 AI 业务营收达 100 亿美元,英伟达是最大功臣
2025-07-22 19:37:31
英伟达推出“Thor”,谁赚了?
2025-08-29 20:44:46
AI教父俯身中国
2025-07-23 17:53:48
Dojo的死亡,特斯拉万亿AI帝国梦的破碎与重生
2025-08-17 20:40:59
商务部部长王文涛会见美国英伟达公司总裁兼首席执行官黄仁勋
2025-07-18 14:43:11
497 文章
192244 浏览
24小时热文
更多

-
2025-09-10 01:24:36
-
2025-09-10 00:24:21
-
2025-09-09 23:22:46