标题:DeepSeek的三场英伟达GTC秀
最早赏识DeepSeek的是英伟达。早在2022年春天,幻方AI(DeepSeek前身)就受邀在英伟达GTC舞台上连续三年演讲。DeepSeek的崛起也给英伟达带来冲击,其推理模型R1使英伟达市值蒸发6000亿美元。
DeepSeek的基础模型V3与推理模型R1,以其高性价比震惊了美国硅谷、华尔街与华盛顿,并激活了国内AI生态的国产替代。DeepSeek创始人梁文锋相信,硬核创新将推动中国新群体性想法的形成。
2022年3月,幻方AI在英伟达GTC上展示了“分时调度AI算力”的演讲。幻方AI通过工程优化与“低成本创新”,将集群使用率提升至95%,相当于多压榨出1倍以上的算力。DeepSeek的软硬件创新,可以追溯到2019年幻方AI成立之初。
2023年,幻方AI再次在GTC上介绍了基于A100的智算基础设施。同年,DeepSeek成立并开始用H800搭建下一代智算集群。DeepSeek的V3模型采用系统架构优化,大幅降低训练和推理成本,达到行业领先水平。
DeepSeek不仅开源模型,还针对硬件厂商提出具体建议。为了应对大模型价值观对齐的挑战,DeepSeek提出“和而不同”的方法,即将整体价值观对齐解耦为不可变的核心价值观对齐与可变的多元化价值观定制。
原文链接
本文链接:https://kx.umi6.com/article/13483.html
转载请注明文章出处
相关推荐
.png)
换一换
Claude 4六个月内发布!Anthropic联创Kaplan:AGI两三年内到来
2025-05-05 09:37:18
DeepSeek开源新版R1 媲美OpenAI最高o3模型
2025-05-29 05:51:14
Kimi和DeepSeek又撞车?
2025-06-04 15:24:39
百度李彦宏:如果没有应用,DeepSeek等 AI 模型和芯片都没有价值
2025-04-25 12:07:38
deepseek公布广度数据采集方法专利 可降低网络资源消耗
2025-04-02 10:20:37
R2来之前,DeepSeek又放了个烟雾弹
2025-05-16 13:58:25
宝马中国将接入DeepSeek!爆新世代车型搭载AI智能体
2025-04-27 14:16:44
DeepSeek推理最高提速6倍!开源研究:加装「思维进度条」,计算量减少30%
2025-07-08 14:44:52
黄仁勋已结束中国之行 知情人士称全程未与DeepSeek会面
2025-04-19 11:43:03
DeepSeek R1 模型完成小版本试升级
2025-05-28 21:25:08
DeepSeek新版R1直追OpenAI o3!实测来了:“小版本升级”着实不小
2025-05-29 11:14:38
李想回应DeepSeek爆火时自己怎么过的春节:带孩子看了哪吒2
2025-05-07 21:18:12
你是否也曾榨干过DeepSeek?
2025-04-21 21:54:35
392 文章
47555 浏览
24小时热文
更多

-
2025-07-24 03:00:03
-
2025-07-24 00:58:43
-
2025-07-23 23:58:33