
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
12月17日,据分析师郭明錤报告,NVIDIA在研发GB300和B300 AI服务器时遇到元件过热问题,主要涉及AOS公司提供的5x5 DrMOS芯片。该问题不仅影响芯片本身,还涉及系统芯片管理设计不足。NVIDIA优先选择AOS的原因在于其设计和生产经验丰富,同时希望通过此技术降低与MPS公司的议价成本。若AOS无法在规定时间内解决问题,NVIDIA可能转向使用成本更高的5x6 DrMOS,或更换供应商。此举可能推迟GB300/B300系统的量产,而GB300预计于2025年中期推出,采用全水冷设计以提升AI算力。
原文链接
标题:一颗芯片带来的焦虑
英伟达今年面临诸多挑战,尤其是其Blackwell GPU。起初,有消息称该款GPU存在设计缺陷,影响了量产进度。尽管英伟达CEO黄仁勋强调问题已解决,但新的问题接踵而至。据报道,Blackwell GPU在高容量服务器机架中遇到过热问题,这导致了设计修改和延迟,影响了其交...
原文链接
英伟达新一代Blackwell GPU被曝存在严重过热问题,导致交付延迟。该处理器专为AI和高性能计算设计,但在高功耗(高达120千瓦)服务器中出现过热现象,影响性能并可能损坏硬件。此问题迫使英伟达多次调整机架设计,进而推迟产品交付。谷歌、Meta和微软等主要客户对能否按计划部署Blackwell服务器表示担忧。英伟达发言人回应称,公司正与云服务提供商紧密合作,通过优化散热系统来解决这一问题。修订后的Blackwell GPU于今年10月底进入量产,预计最早于明年1月底出货。原定于今年第二季度发货的计划因此受到影响。此次技术瓶颈对依赖英伟达GPU进行AI模型训练的科技巨头的研发进度产生显著影响。
原文链接
加载更多

暂无内容