标题:一颗芯片带来的焦虑
英伟达今年面临诸多挑战,尤其是其Blackwell GPU。起初,有消息称该款GPU存在设计缺陷,影响了量产进度。尽管英伟达CEO黄仁勋强调问题已解决,但新的问题接踵而至。据报道,Blackwell GPU在高容量服务器机架中遇到过热问题,这导致了设计修改和延迟,影响了其交付时间。
过热问题迫使英伟达多次重新评估服务器机架设计。客户担心这些问题会阻碍新处理器在数据中心的部署。英伟达已指示供应商对机架进行多项设计修改以解决过热问题,尽管这些调整增加了延迟,但公司仍与云服务提供商和供应商密切合作,以确保最终产品的性能和可靠性。
Blackwell GPU的量产进度一拖再拖,直到10月底才进入量产阶段,预计明年1月底开始发货。过热问题已成为英伟达面临的主要挑战之一,涉及芯片、LSI桥、中介层和主板基板之间的热膨胀特性不匹配。为了解决这个问题,英伟达对GPU芯片的顶部金属层和焊点结构进行了修改。
过热问题不仅限于Blackwell GPU,此前英伟达准备使用的HBM也传出过热问题,直到几个月后才解决。过热问题不仅影响了芯片性能,还可能导致组件损坏。半导体分析公司Semianalysis的首席分析师表示,散热将是未来芯片设计的关键关注点。
大型数据中心需要液冷来解决散热问题,以避免早期失效和停机时间,从而影响总拥有成本。Meta已重新设计数据中心以适应未来的散热需求。尽管液冷面临工程和运营挑战,但英伟达已提出一种结合液体冷却和浸没式冷却的解决方案,以降低数据中心冷却所消耗的电力。
英伟达正在与多家公司合作,包括BOYD Corp、Durbin Group、Honeywell和Vertiv,以推进这种双温区冷却系统。英特尔也在开发类似的系统,但财务困境导致了一些项目受阻。
原文链接
本文链接:https://kx.umi6.com/article/9536.html
转载请注明文章出处
相关推荐
换一换
英伟达悄然修改技术论文错误表述 大幅下调数据中心铜使用量
2026-01-16 11:37:08
中东战火“反噬”美国AI发展:英伟达等科技巨头或最受伤!
2026-03-25 16:39:43
黄仁勋呼吁所有人使用AI提升自己:大学生毕业时都要成AI专家
2026-03-24 22:28:35
英伟达CEO黄仁勋:将在GTC大会发布“世界前所未见”的全新芯片
2026-02-19 13:26:25
H200春节前重返中国,黄仁勋有多少胜算?
2025-12-25 18:54:36
英伟达押注下一个万亿级机遇 入局AI服务器系统
2026-03-17 16:49:00
黄仁勋台北「夜宴」
2026-02-05 02:21:17
英伟达和Meta宣布建立多年战略合作伙伴关系 Meta将部署数百万颗英伟达芯片
2026-02-18 06:11:18
英伟达遭版权诉讼,被指联系影子图书馆获取 500TB 盗版数据
2026-01-20 19:25:39
黄仁勋反悔,不投千亿美元给OpenAI了?
2026-02-03 02:13:44
特斯拉巨鲸廖凯原买入100万股英伟达 将再买100万股以支持紧张的市场
2026-03-04 18:04:30
景林最新美股持仓:谷歌升至第一大重仓 高位减持英伟达
2026-02-07 04:35:20
应对 AI 时代“缺电”之困,消息称英伟达下周举办闭门峰会
2025-12-12 23:16:20
714 文章
582640 浏览
24小时热文
更多
-
2026-04-24 16:22:09 -
2026-04-24 16:21:03 -
2026-04-24 16:19:57