标题:DeepSeek的三场英伟达GTC秀
最早赏识DeepSeek的是英伟达。早在2022年春天,幻方AI(DeepSeek前身)就受邀在英伟达GTC舞台上连续三年演讲。DeepSeek的崛起也给英伟达带来冲击,其推理模型R1使英伟达市值蒸发6000亿美元。
DeepSeek的基础模型V3与推理模型R1,以其高性价比震惊了美国硅谷、华尔街与华盛顿,并激活了国内AI生态的国产替代。DeepSeek创始人梁文锋相信,硬核创新将推动中国新群体性想法的形成。
2022年3月,幻方AI在英伟达GTC上展示了“分时调度AI算力”的演讲。幻方AI通过工程优化与“低成本创新”,将集群使用率提升至95%,相当于多压榨出1倍以上的算力。DeepSeek的软硬件创新,可以追溯到2019年幻方AI成立之初。
2023年,幻方AI再次在GTC上介绍了基于A100的智算基础设施。同年,DeepSeek成立并开始用H800搭建下一代智算集群。DeepSeek的V3模型采用系统架构优化,大幅降低训练和推理成本,达到行业领先水平。
DeepSeek不仅开源模型,还针对硬件厂商提出具体建议。为了应对大模型价值观对齐的挑战,DeepSeek提出“和而不同”的方法,即将整体价值观对齐解耦为不可变的核心价值观对齐与可变的多元化价值观定制。
原文链接
本文链接:https://kx.umi6.com/article/13483.html
转载请注明文章出处
相关推荐
换一换
六大AI模型被扔进加密市场厮杀,DeepSeek暂为交易之王
2025-10-20 18:12:39
DeepSeek新大招曝光:下一步智能体
2025-09-05 10:15:28
六大AI拿1万美元真实交易:DeepSeek最能赚,GPT-5亏麻了,AI能让周杰伦少亏上亿
2025-10-20 17:12:32
DeepSeek母公司去年进账50亿,够烧2380个R1
2026-01-13 16:43:30
MAU被豆包反超,Deepseek挤了点牙膏
2025-10-21 15:28:27
DeepSeek 通知线上模型版本升级至 V3.1,上下文长度拓展至 128k
2025-08-19 21:05:45
被AI「摩擦」的十天:一个普通人的上手记
2025-08-16 18:28:03
DeepSeek发布新论文提出更为高效的AI开发方法
2026-01-02 18:32:56
淘宝上卖9块9的DeepSeek,让我看到了被折叠的魔幻世界
2025-09-16 12:10:49
DeepSeek新模型上线!引入DSA新稀疏注意力,还又狙了CUDA一枪
2025-09-29 19:13:01
DeepSeek线上模型升级:当前版本号 DeepSeek-V3.1-Terminus
2025-09-22 21:05:30
梁文锋,Nature全球年度十大科学人物!
2025-12-09 10:25:17
工信部:系统推进6G技术研发、标准研制和应用培育 统筹推动算力布局、算力结构、算力调度等升级优化
2025-12-26 19:00:18
664 文章
515794 浏览
24小时热文
更多
-
2026-04-24 15:20:44 -
2026-04-24 15:19:39 -
2026-04-24 15:18:33