标题:一颗芯片带来的焦虑
英伟达今年面临诸多挑战,尤其是其Blackwell GPU。起初,有消息称该款GPU存在设计缺陷,影响了量产进度。尽管英伟达CEO黄仁勋强调问题已解决,但新的问题接踵而至。据报道,Blackwell GPU在高容量服务器机架中遇到过热问题,这导致了设计修改和延迟,影响了其交付时间。
过热问题迫使英伟达多次重新评估服务器机架设计。客户担心这些问题会阻碍新处理器在数据中心的部署。英伟达已指示供应商对机架进行多项设计修改以解决过热问题,尽管这些调整增加了延迟,但公司仍与云服务提供商和供应商密切合作,以确保最终产品的性能和可靠性。
Blackwell GPU的量产进度一拖再拖,直到10月底才进入量产阶段,预计明年1月底开始发货。过热问题已成为英伟达面临的主要挑战之一,涉及芯片、LSI桥、中介层和主板基板之间的热膨胀特性不匹配。为了解决这个问题,英伟达对GPU芯片的顶部金属层和焊点结构进行了修改。
过热问题不仅限于Blackwell GPU,此前英伟达准备使用的HBM也传出过热问题,直到几个月后才解决。过热问题不仅影响了芯片性能,还可能导致组件损坏。半导体分析公司Semianalysis的首席分析师表示,散热将是未来芯片设计的关键关注点。
大型数据中心需要液冷来解决散热问题,以避免早期失效和停机时间,从而影响总拥有成本。Meta已重新设计数据中心以适应未来的散热需求。尽管液冷面临工程和运营挑战,但英伟达已提出一种结合液体冷却和浸没式冷却的解决方案,以降低数据中心冷却所消耗的电力。
英伟达正在与多家公司合作,包括BOYD Corp、Durbin Group、Honeywell和Vertiv,以推进这种双温区冷却系统。英特尔也在开发类似的系统,但财务困境导致了一些项目受阻。
原文链接
本文链接:https://kx.umi6.com/article/9536.html
转载请注明文章出处
相关推荐
换一换
英伟达砸15亿美元 从Lambda租用搭载自家芯片的GPU服务器
2025-09-05 15:26:12
英伟达AI超级计算机DGX Spark™正式交付
2025-10-14 13:17:28
业内人士:OpenAI与甲骨文和英伟达合作形成商业闭环
2025-09-24 18:51:20
英伟达将收购50亿美元的英特尔股份 每股作价23.28美元
2025-09-18 20:01:36
英伟达宣布 DGX Spark 桌面 AI 超算 15 日正式发售,3999 美元
2025-10-14 10:13:52
AI 云 CoreWeave 获 Meta、OpenAI 追单,新交易合计 207 亿美元
2025-10-02 16:18:37
阿里巴巴宣布与英伟达开展Physical AI合作
2025-09-24 15:49:08
三星突破重大难关:HBM芯片终获英伟达认可 股价创一年新高
2025-09-22 14:00:58
这一战,谷歌准备了十年
2025-09-16 09:09:59
英伟达、甲骨文、OpenAI 动辄千亿的三角游戏闭环了?
2025-09-23 12:14:59
消息称英伟达将投资马斯克的 xAI,成 200 亿美元融资参与方
2025-10-09 09:08:25
投资OpenAI但不会冷待其他客户!英伟达:会将每一位客户放在首位
2025-09-23 17:24:31
黄仁勋:英伟达在华高端芯片市场份额已从95%降至0% 美对华技术封锁是一个“错误”
2025-10-17 19:26:36
544 文章
271926 浏览
24小时热文
更多
-
2025-10-28 18:01:27 -
2025-10-28 18:00:23 -
2025-10-28 17:58:16