DeepSeek-V3：美国芯片封锁的“意外”产物？

2025-01-06 10:21:20

智能视野

发布在

快讯

阅读：407

DeepSeek公司发布了全新AI模型DeepSeek-V3，仅用2048块H800显卡、耗时两个月便训练出6710亿参数模型，效率比Meta高11倍。DeepSeek-V3采用MoE架构和MLA机制，结合FP8混合精度框架和DualPipe算法，大幅提升了训练效率。这一成就在芯片受限环境下尤为突出，显示了软件创新突破硬件限制的潜力。DeepSeek-V3的成功引发了市场对AI领域‘卖铲人’地位变化的担忧，英伟达股价一度下跌。

原文链接

本文链接：https://kx.umi6.com/article/11196.html

转载请注明文章出处

AI模型