
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
DeepSeek-V3的发布在AI行业内引发震动,该模型参数量高达671B,仅用2048块GPU训练2个月,花费557.6万美元,性能媲美或优于其他前沿大模型。DeepSeek-V3采用多头潜在注意力和DeepSeekMoE技术,提高了推理性能。尽管有观点认为这预示着AI大模型对算力需求将大幅下降,但也有专家指出,这只是训练成本降低,实际推理仍需大量算力。Lepton AI创始人贾扬清表示,已进入分布式推理时代。中信证券研报指出,DeepSeek-V3将推动AI大模型的广泛应用,提升训练和推理效率。AI行业正从预训练转向推理时代,推理算力需求或将激增,预计豆包大模型将带来759至1898亿元的AI服务器资本开支需求。
原文链接
加载更多

暂无内容