新年之际,我撰写了公众号的第二篇文章。上一篇关于Sam和Ilya的文章引起了广泛关注,希望这一篇也能引发共鸣。
作为北美PhD,前Meta AI员工,目前从事AI创业,我对DeepSeek的震撼体验巨大。春节期间,我反复阅读其论文,惊叹不已。
DeepSeek颠覆了中美两国对创新的认知。这背后是一种深层次的结构性能力和新范式,是梁文锋及其团队有意或无意间塑造的。DeepSeek的最大启示在于其创新的三重门:
- 小天才的规模化
- 华为式的军团平推
- 哲学式的原创思想
DeepSeek的论文展示了多个原创研究工作,如Math、V2、V3、R1、Janus等。这些创新涉及复杂的软硬件设计,如MLA、GRPO、DeepSeekMoE等,达到了顶会最佳论文水平。
团队中的年轻成员如吴作凡、任之洲、周雨杨、罗煜翔等,展现了小天才般的创新能力。他们不仅有能力学习,更没有unlearn的负担,能够突破传统思维束缚。
DeepSeek还体现了华为式的军团平推,从底层硬件到上层算法,形成了一个复杂的大系统。这需要高度协同的创新,如自研HAI LLM训练框架,设计MLA、DeepSeekMoE等。
最后,DeepSeek展示了哲学式的原创思想,类似于Transformer、AlphaZero和GPT所代表的学习本质。这不仅是技术上的突破,更是思想上的革新。
原文链接
本文链接:https://kx.umi6.com/article/12627.html
转载请注明文章出处
相关推荐
.png)
换一换
第一批用DeepSeek推荐的人,已上当
2025-04-18 13:12:51
ColorOS 小布助手月活量达 1.5 亿,OPPO 手机(含一加)接入 DeepSeek 设备量行业第一
2025-06-10 15:49:36
DeepSeek降本秘诀曝光
2025-07-05 11:59:25
华为 + DeepSeek 推理性能创新高,技术报告公布
2025-05-19 14:19:50
DeepSeek流量下滑,这半年梁文锋都干了啥?
2025-07-14 14:22:04
微软首次公开:已禁止员工使用DeepSeek应用!
2025-05-09 13:53:07
实测车载DeepSeek:理财哄娃,做北京旅游攻略,避开喝豆汁儿那种
2025-04-04 15:16:12
李想回应DeepSeek爆火时自己怎么过的春节:带孩子看了哪吒2
2025-05-07 21:18:12
超 346 款生成式 AI 完成备案:DeepSeek 上线 20 天全球日活跃用户即突破 3000 万
2025-07-21 11:16:03
梁文锋等来及时雨
2025-07-15 17:50:04
DeepSeek 梁文锋入选《时代》周刊“2025 年全球最具影响力 100 人”
2025-04-18 23:25:46
(更新:对话功能恢复正常)DeepSeek 出现服务问题,登录失败、无法对话
2025-05-13 18:55:32
谁是开源界的杠把子?
2025-04-11 13:50:08
468 文章
84177 浏览
24小时热文
更多

-
2025-07-22 17:39:06
-
2025-07-22 17:38:56
-
2025-07-22 17:37:59