1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

SemiAnalysis最新报告分析了DeepSeek事件,涉及中国在成本、真实训练成本、封闭模型利润率影响方面的领先地位,包括H100价格飙升、补贴推理定价、出口管制、多头潜在注意力机制等内容。春节假期期间,DeepSeek引起广泛关注,报告质疑其拥有5万张H100的说法,但未见官方确认。

深度求索席卷全球

DeepSeek在全球范围内引起轰动,日访问量超越Claude、Perplexity和Gemini。尽管如此,SemiAnalysis认为炒作过多。舆论风向逆转,从质疑英伟达不利到认可其效率,这些模型对H100和H200定价产生实际影响。

High-Flyer与深度求索

High-Flyer是一家中国对冲基金,早于2021年购买了10000个A100 GPU。2023年5月,High-Flyer分拆出专注AI的深度求索。该公司目前约有150名员工,招聘条件宽松,重视能力和求知欲。投资估计超过5亿美元。

GPU情况

深度求索拥有约50000个Hopper GPU,包括10000个H800和10000个H100。这些GPU主要用于交易、推理、训练和研究。成本方面,服务器总资本支出接近13亿美元,运营成本高达7.15亿美元。

成本与性能

深度求索的V3模型训练成本被误解,实际总成本远高于600万美元。模型开发需大量资金,混合专家模型等创新技术提高了效率,降低了推理成本。V3与GPT-4o相比,体现了算法改进带来的进步。

技术成就

深度求索的V3模型采用了多令牌预测技术,提高了训练和推理性能。混合专家模型通过“门控网络”提高路由效率。MLA技术大幅减少了KV缓存,降低了推理成本。谷歌的Gemini Flash 2.0 Thinking价格更低,性能更优。

利润率影响

R1以零利润率定价,反映了能力竞争的趋势。H100价格飙升,反映了需求增加。出口管制对深度求索获取芯片造成影响,中国银行宣布未来5年将提供1400亿美元补贴,支持人工智能发展。

未来展望

未来,算法和硬件将持续进步,美国实验室可能达到中国难以企及的高度。深度求索有可能不再开源模型,尤其是在中国政府加强保护的情况下。

原文链接
本文链接:https://kx.umi6.com/article/12536.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
2026,AI算力新江湖
2026-01-31 12:36:53
DeepSeek“点燃”国产芯片 FP8能否引领行业新标准?
2025-08-24 11:14:54
全球 6 大顶级 AI 实盘厮杀,Deepseek 三天收益爆赚 36% 傲视群雄
2025-10-22 08:40:07
DeepSeek 出现服务故障:网页 / API 性能异常,已进行修复
2025-11-25 16:59:50
需求塞爆服务器,OpenAI、谷歌对 Sora 和 Nano Banana Pro 采取“限流”措施
2025-11-29 23:44:54
智谱创始人唐杰谈 DeepSeek:很震撼,开启了“AI 做事”新范式
2026-01-12 09:23:20
报道称DeepSeek计划年底前发布AI智能体 公司暂无回应
2025-09-04 17:05:24
阿里云:采购寒武纪15万片GPU的消息不实,寒武纪股价跳水
2025-09-01 11:16:19
扎克伯格:我们的慈善机构无需更多实验室与人员,“只想要 GPU”
2025-11-11 20:24:38
DeepSeek刷屏论文背后:除了梁文锋,还有一个18岁中国高中生,曾写出神级提示词
2025-09-19 11:14:40
梁文锋代表DeepSeek,他代表梁文锋
2025-11-16 12:31:32
英伟达财报会实录:三大转型驱动AI基建投资 5000亿美元收入目标有望再突破
2025-11-20 09:13:51
两个月斩获微软四笔订单 “英版甲骨文”或计划明年IPO
2025-10-16 00:43:21
24小时热文
更多
扫一扫体验小程序