1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

DeepSeek-V3的发布在AI行业内引发震动,该模型参数量高达671B,仅用2048块GPU训练2个月,花费557.6万美元,性能媲美或优于其他前沿大模型。DeepSeek-V3采用多头潜在注意力和DeepSeekMoE技术,提高了推理性能。尽管有观点认为这预示着AI大模型对算力需求将大幅下降,但也有专家指出,这只是训练成本降低,实际推理仍需大量算力。Lepton AI创始人贾扬清表示,已进入分布式推理时代。中信证券研报指出,DeepSeek-V3将推动AI大模型的广泛应用,提升训练和推理效率。AI行业正从预训练转向推理时代,推理算力需求或将激增,预计豆包大模型将带来759至1898亿元的AI服务器资本开支需求。

原文链接
本文链接:https://kx.umi6.com/article/10937.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
商汤徐立:未来核心战略在于无缝集成基础设施、人工智能模型和应用
2024-10-18 16:51:12
中国移动具身智能产业创新中心招聘会即将开启 涉及人形机器人硬件产品经理等27个职位
2025-03-13 11:15:51
高调挖人!背靠奥尔特曼的Rain AI招募苹果老将开发新型芯片
2024-06-28 21:09:27
24小时热文
更多
扫一扫体验小程序