DeepSeek近日因其突破性进展引发关注。该公司投入超5亿美元,拥有约5万块Hopper GPU,招募150多名顶尖人才,年薪高达934万人民币。DeepSeek的多头潜注意力机制(MLA)将查询KV量减少93.3%,显著降低推理成本。其模型R1在性能上与o1相当,但成本更低。DeepSeek的成功挑战了OpenAI的市场地位,推动了AI领域的竞争。
原文链接
本文链接:https://kx.umi6.com/article/12445.html
转载请注明文章出处
相关推荐
换一换
DeepSeek首登《自然》封面:中国大模型创造新历史,做了OpenAI不敢做的事
2025-09-18 16:58:59
梁文锋,准备战斗
2025-07-30 17:51:33
美称中国一人工智能企业违反美出口管制 外交部:中方已多次表明原则立场
2026-02-24 15:53:46
DeepSeek昨天悄悄扔的炸弹,今天爆了
2025-08-22 17:51:00
DeepSeek成了硅谷最大的“不能说的秘密”
2025-09-23 17:20:46
北大团队改造DeepSeek注意力,速度快四倍还不丢精度
2026-04-07 00:20:16
DeepSeek突然拥抱国产GPU语言!对标CUDA替代Triton,华为Day0适配
2025-09-30 10:23:35
梁文锋,Nature全球年度十大科学人物!
2025-12-09 10:25:17
报道称DeepSeek计划年底前发布AI智能体 公司暂无回应
2025-09-04 17:05:24
DeepSeek网页、APP服务出现重大中断
2026-03-30 08:41:20
DeepSeek母公司去年进账50亿,够烧2380个R1
2026-01-13 16:43:30
DeepSeek深夜更新后自曝:我是V4(?!)
2026-04-08 12:51:42
DeepSeek 开年发布新论文:提出全新 mHC 架构,梁文锋现身作者名单
2026-01-01 17:23:53
696 文章
536003 浏览
24小时热文
更多
-
2026-04-24 23:43:31 -
2026-04-24 23:42:26 -
2026-04-24 23:41:21