DeepSeek的三场英伟达GTC秀

2025-02-16 11:23:01

DeepSeek的三场英伟达GTC秀

心智奇点

发布在

科普

阅读：927

标题：DeepSeek的三场英伟达GTC秀

最早赏识DeepSeek的是英伟达。早在2022年春天，幻方AI（DeepSeek前身）就受邀在英伟达GTC舞台上连续三年演讲。DeepSeek的崛起也给英伟达带来冲击，其推理模型R1使英伟达市值蒸发6000亿美元。

DeepSeek的基础模型V3与推理模型R1，以其高性价比震惊了美国硅谷、华尔街与华盛顿，并激活了国内AI生态的国产替代。DeepSeek创始人梁文锋相信，硬核创新将推动中国新群体性想法的形成。

2022年3月，幻方AI在英伟达GTC上展示了“分时调度AI算力”的演讲。幻方AI通过工程优化与“低成本创新”，将集群使用率提升至95%，相当于多压榨出1倍以上的算力。DeepSeek的软硬件创新，可以追溯到2019年幻方AI成立之初。

2023年，幻方AI再次在GTC上介绍了基于A100的智算基础设施。同年，DeepSeek成立并开始用H800搭建下一代智算集群。DeepSeek的V3模型采用系统架构优化，大幅降低训练和推理成本，达到行业领先水平。

DeepSeek不仅开源模型，还针对硬件厂商提出具体建议。为了应对大模型价值观对齐的挑战，DeepSeek提出“和而不同”的方法，即将整体价值观对齐解耦为不可变的核心价值观对齐与可变的多元化价值观定制。

原文链接

本文链接：https://kx.umi6.com/article/13483.html

转载请注明文章出处

DeepSeek

算力优化

英伟达GTC

分享至

打开微信扫一扫

内容投诉

生成图片

心智奇点

699 文章

753233 浏览

24小时热文