标题:全网都在扒的DeepSeek团队,是清北应届生撑起一片天
梦晨 西风 发自 凹非寺
量子位 | 公众号 QbitAI
DeepSeek-v3大模型横空出世,以1/11算力超越Llama 3 405B开源模型,震撼AI圈。随后,“雷军开千万年薪挖DeepSeek研究员罗福莉”的传闻,使人们聚焦于DeepSeek人才。全网好奇,连小红书上也有人询问,这究竟是怎样的团队?
国际上,创始人梁文锋的访谈被翻译成英语并附注释,试图揭示公司崛起的线索。量子位发现,DeepSeek团队最大的特点是年轻,尤其是来自清北的应届生非常活跃。他们中的一些人,2024年一边在DeepSeek搞研究,一边获得博士学位。
高华佐和曾旺丁为MLA架构做出了关键创新。高华佐来自北大物理系,曾旺丁来自北邮。邵智宏是清华博士生,主导开发了DeepSeek-Coder-V1。朱琪豪是北大博士毕业生,主导了DeepSeek-Coder-V1的开发。代达劢,北大博士生,学术成果丰富,参与了多项工作。
梁文锋强调招人看能力而非经验,团队成员年轻化,博士在读、应届及毕业一两年的成员占多数。团队重视模型算法和硬件工程配合,有1/11算力训练出高性能DeepSeek-v3的成果。团队运作灵活,不做前置岗位分工,重视新人和潜力方向。
原文链接
本文链接:https://kx.umi6.com/article/11166.html
转载请注明文章出处
相关推荐
.png)
换一换
大模型抢滩高考志愿填报,能否顶替「张雪峰」们?
2025-07-02 13:06:37
DeepSeek推理最高提速6倍!开源研究:加装「思维进度条」,计算量减少30%
2025-07-08 14:44:52
德国要求苹果与谷歌下架DeepSeek应用 中方已多次明确表态
2025-06-28 12:19:15
454 文章
61244 浏览
24小时热文
更多

-
2025-07-19 20:57:00
-
2025-07-19 18:55:37
-
2025-07-19 17:56:25