本周二,Nvidia的股价再次超越苹果,成为全球最有价值的公司。在过去两年中,Nvidia凭借GPU的强大算力,在AI时代取得了巨大市场成功。
然而,尽管GPU技术飞速发展,一些短板技术正在成为英伟达发展的隐性障碍,影响其进一步突破。
高歌猛进的GPU
近一两年,GPU的速度迭代非常快,很大程度上是由于生成式AI(大模型)的爆发式增长。IDC预测,到2027年,全球生成式AI市场规模将达1454亿美元,中国市场也将达到129亿美元。技术迭代加速、应用领域拓宽及企业对AI创新驱动的不懈投入,推动了这一发展趋势。算力是生成式AI发展的物理基础,GPU是加速计算的主要工具。为了实现大模型的突破,需要大幅提高GPU的性能。GPU目前正进入一种“自我加速”的发展模式。英伟达和AMD等厂商必须不断推陈出新,才能满足需求。过去八年,英伟达的GPU性能提升了1000多倍,但价格仅上涨了7.5倍。新款Blackwell GPU系统比上一代H100系统推理速度快30倍。Nvidia的市值自2023年初以来增长了近十倍,从3600亿美元增至超过3.4万亿美元。
跟不上的互联技术
GPU的快速发展也带来了新问题。传统的PCIe接口的带宽已难以支撑日益增长的数据传输需求,限制了GPU的最大性能释放。为应对这一瓶颈,英伟达开发了NVLink和InfiniBand。NVLink用于GPU之间的高速点对点互连,提供高带宽和低延迟的数据传输。InfiniBand具有更高的带宽、更低的延迟,适合高性能计算和AI训练。AMD推出了Infinity Fabric,但其性能不及NVLink。超级以太网联盟(UEC)成立,旨在对标InfiniBand。UEC已有67家公司加入,有望为初创公司提供优化TCO的网络方案。
存储更吃力
存储技术的进步相对滞后。GPU依赖高带宽内存(HBM)来满足高速数据交换需求。HBM已成为大模型训练的标准配置。SK海力士正加速推进HBM技术的更新迭代,但面临生产能力、技术瓶颈和成本等挑战。存储瓶颈导致计算能力浪费、AI训练效率下降和大规模数据处理障碍。为解决这一问题,业界提出了存算一体和智能存储架构,如CXL和NVMe协议,以实现更高效的存储扩展和更低延迟的数据访问。
总结
在快速演变的技术生态系统中,多技术协同升级是推动新兴技术发展的核心动力。要实现算力的持续增长,GPU、互联、存储等技术必须协调发展。对于英伟达等科技巨头而言,推动GPU与其他关键技术的协同进化,解决存储、互联的瓶颈,将是未来几年的主要挑战。
.png)

-
2025-07-19 18:55:37
-
2025-07-19 17:56:25
-
2025-07-19 17:55:01