标题:全网都在扒的DeepSeek团队,是清北应届生撑起一片天
梦晨 西风 发自 凹非寺
量子位 | 公众号 QbitAI
DeepSeek-v3大模型横空出世,以1/11算力超越Llama 3 405B开源模型,震撼AI圈。随后,“雷军开千万年薪挖DeepSeek研究员罗福莉”的传闻,使人们聚焦于DeepSeek人才。全网好奇,连小红书上也有人询问,这究竟是怎样的团队?
国际上,创始人梁文锋的访谈被翻译成英语并附注释,试图揭示公司崛起的线索。量子位发现,DeepSeek团队最大的特点是年轻,尤其是来自清北的应届生非常活跃。他们中的一些人,2024年一边在DeepSeek搞研究,一边获得博士学位。
高华佐和曾旺丁为MLA架构做出了关键创新。高华佐来自北大物理系,曾旺丁来自北邮。邵智宏是清华博士生,主导开发了DeepSeek-Coder-V1。朱琪豪是北大博士毕业生,主导了DeepSeek-Coder-V1的开发。代达劢,北大博士生,学术成果丰富,参与了多项工作。
梁文锋强调招人看能力而非经验,团队成员年轻化,博士在读、应届及毕业一两年的成员占多数。团队重视模型算法和硬件工程配合,有1/11算力训练出高性能DeepSeek-v3的成果。团队运作灵活,不做前置岗位分工,重视新人和潜力方向。
原文链接
本文链接:https://kx.umi6.com/article/11166.html
转载请注明文章出处
相关推荐
.png)
换一换
谁是2025年度最好的编程语言?
2025-10-01 10:42:36
混乱、内耗、丑闻:Meta考虑向Google、OpenAI低头
2025-08-31 15:02:37
中国大模型首登Nature封面!DeepSeek首次披露:R1训练只花200万
2025-09-18 13:51:50
DeepSeek等开源模型,更“浪费”token吗?
2025-10-11 10:17:13
腾讯、阿里和小米在列!AI“六巨头”正引领今年新兴市场涨幅?
2025-08-18 11:45:29
DeepSeek刷屏论文背后:除了梁文锋,还有一个18岁中国高中生,曾写出神级提示词
2025-09-19 11:14:40
DeepSeek 线上模型升级至 V3.1-Terminus 版本,改进语言一致性及 Agent 能力
2025-09-22 21:02:17
Transformer作者:DeepSeek才有搞头,OpenAI指望不上了
2025-09-12 11:09:05
华尔街掀起“AI抢饭碗”浪潮
2025-10-16 19:00:34
DeepSeek V3.1突现离谱Bug:“极”字满屏乱蹦,开发者一脸懵逼
2025-08-26 14:46:26
淘宝上卖9块9的DeepSeek,让我看到了被折叠的魔幻世界
2025-09-16 12:10:49
QuestMobile 报告:豆包月活超越 DeepSeek,夺 8 月中国原生 AI App 月活第一
2025-09-16 18:17:35
那天,AI大模型想起了,被「失忆」所束缚的枷锁
2025-09-01 16:21:15
565 文章
255008 浏览
24小时热文
更多

-
2025-10-23 21:15:29
-
2025-10-23 20:16:19
-
2025-10-23 20:15:12