DeepSeek预示算力需求“打骨折”？业界：别只盯着训练 AI行业进入推理时代

2024-12-30 09:15:53

像素宇宙

发布在

快讯

阅读：7

DeepSeek-V3的发布在AI行业内引发震动，该模型参数量高达671B，仅用2048块GPU训练2个月，花费557.6万美元，性能媲美或优于其他前沿大模型。DeepSeek-V3采用多头潜在注意力和DeepSeekMoE技术，提高了推理性能。尽管有观点认为这预示着AI大模型对算力需求将大幅下降，但也有专家指出，这只是训练成本降低，实际推理仍需大量算力。Lepton AI创始人贾扬清表示，已进入分布式推理时代。中信证券研报指出，DeepSeek-V3将推动AI大模型的广泛应用，提升训练和推理效率。AI行业正从预训练转向推理时代，推理算力需求或将激增，预计豆包大模型将带来759至1898亿元的AI服务器资本开支需求。

原文链接

本文链接：https://kx.umi6.com/article/10937.html

转载请注明文章出处

Deepseek-v3