亚马逊云科技在2024年re:Invent全球大会上宣布了其AI硬件的最新进展,推出基于Amazon Trainium2芯片的Amazon EC2 Trn2实例,并发布了新一代AI训练芯片Trainium3。
Amazon EC2 Trn2实例采用最新的Trainium2芯片,与现有基于GPU的EC2实例相比,性价比较高出30-40%。每个Trn2实例配备16个Trainium2芯片,提供高达20.8 Petaflops的浮点算力,适合训练和部署大型语言模型。
为满足日益增长的AI计算需求,亚马逊还推出了Trn2 UltraServers。这种服务器通过NeuronLink超速互连技术连接四个Trn2服务器,形成具备83.2 Petaflops计算能力的超大型服务器,专门用于超大规模AI模型的训练和推理。
亚马逊云科技还宣布了Trainium3的推出,这是首款采用3纳米工艺制造的AI芯片,性能、能效和密度均创行业新高。搭载Trainium3的UltraServers性能预计是Trn2 UltraServers的四倍,预计在2025年末上线,为大规模生成式AI模型提供更快的训练速度和更好的实时性能。
亚马逊致力于提供更高效的解决方案,减少AI幻觉并提高模型准确性。例如,通过自动推理功能确保大语言模型的输出更加可靠。此外,亚马逊与Anthropic合作,共同打造了包含数十万个Trainium2芯片的EC2 UltraCluster计算集群,算力达到当前最先进AI模型训练所需算力的五倍以上。
亚马逊还发布了Amazon Neuron软件套件,帮助开发者更好地利用Trainium芯片的性能。该软件包括编译器、运行时库和工具,与JAX和PyTorch等框架无缝集成,使开发者能够轻松优化模型,在Trainium芯片上实现最佳性能。
这些创新不仅显著降低了企业部署AI的成本,还提高了生成式AI在各个行业的应用效果,帮助企业提升业务表现和降低运营成本。
.png)

-
2025-07-19 22:57:32
-
2025-07-19 21:58:20
-
2025-07-19 21:57:13