1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:DeepSeek的三场英伟达GTC秀

最早赏识DeepSeek的是英伟达。早在2022年春天,幻方AI(DeepSeek前身)就受邀在英伟达GTC舞台上连续三年演讲。DeepSeek的崛起也给英伟达带来冲击,其推理模型R1使英伟达市值蒸发6000亿美元。

DeepSeek的基础模型V3与推理模型R1,以其高性价比震惊了美国硅谷、华尔街与华盛顿,并激活了国内AI生态的国产替代。DeepSeek创始人梁文锋相信,硬核创新将推动中国新群体性想法的形成。

2022年3月,幻方AI在英伟达GTC上展示了“分时调度AI算力”的演讲。幻方AI通过工程优化与“低成本创新”,将集群使用率提升至95%,相当于多压榨出1倍以上的算力。DeepSeek的软硬件创新,可以追溯到2019年幻方AI成立之初。

2023年,幻方AI再次在GTC上介绍了基于A100的智算基础设施。同年,DeepSeek成立并开始用H800搭建下一代智算集群。DeepSeek的V3模型采用系统架构优化,大幅降低训练和推理成本,达到行业领先水平。

DeepSeek不仅开源模型,还针对硬件厂商提出具体建议。为了应对大模型价值观对齐的挑战,DeepSeek提出“和而不同”的方法,即将整体价值观对齐解耦为不可变的核心价值观对齐与可变的多元化价值观定制。

原文链接
本文链接:https://kx.umi6.com/article/13483.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
DeepSeek新大招曝光:下一步智能体
2025-09-05 10:15:28
DeepSeek新模型上线!引入DSA新稀疏注意力,还又狙了CUDA一枪
2025-09-29 19:13:01
梁文锋等来及时雨
2025-07-15 17:50:04
DeepSeek:已在平台内对 AI 生成合成内容添加标识,用户不得恶意删除
2025-09-01 18:24:35
DeepSeek 声明:防范冒用“深度求索”名义实施诈骗
2025-09-18 12:52:40
德国要求苹果与谷歌下架DeepSeek应用 中方已多次明确表态
2025-06-28 12:19:15
好险,差点被DeepSeek幻觉害死
2025-07-09 15:08:10
DeepSeek新模型上线
2025-09-30 11:25:43
DeepSeek发布两款新模型
2025-12-01 19:31:03
六大AI模型被扔进加密市场厮杀,DeepSeek暂为交易之王
2025-10-20 18:12:39
DeepSeek终于把OpenAI逼急了
2025-08-06 16:35:39
DeepSeek又更新了,期待梁文锋“炸场”
2025-08-21 09:28:01
DeepSeek成了硅谷最大的“不能说的秘密”
2025-09-23 17:20:46
24小时热文
更多
扫一扫体验小程序