标题:英伟达面临强劲对手:DeepSeek-V3
神秘的东方力量再次震惊世界,这次是大模型。12月26日,幻方量化旗下的DeepSeek发布新一代开源大模型DeepSeek-V3,该模型参数量高达671B,仅用2048块GPU训练2个月,总成本557.6万美元。这意味着DeepSeek-V3的训练成本仅为GPT-4o的二十分之一。
在性能方面,DeepSeek-V3在多个任务上表现优异,甚至超越其他开源大模型,与GPT-4o和Claude 3.5 Sonnet相比也毫不逊色。广发证券分析称,DeepSeek-V3的算力成本降低得益于DeepSeekMoE和MLA架构的优化。
DeepSeek不仅是大模型价格战的最早发起者,还提供了史无前例的性价比。在定价上,DeepSeek-V3 API每百万tokens输入费用为0.5元(缓存命中)/2元(缓存未命中),输出费用为8元,性价比较高。
DeepSeek由知名量化私募幻方量化创立,拥有强大的算力储备。幻方量化创始人梁文锋表示,他们致力于推动技术前沿,降低成本,使AI普惠大众。
原文链接
本文链接:https://kx.umi6.com/article/11045.html
转载请注明文章出处
相关推荐
.png)
换一换
美的副总裁王建国:未来三年计划投入 500 亿元以上布局 AI 大模型
2025-07-09 12:03:02
DeepSeek 清华原版宝典:工作、学习、生活、科研中的难题,轻松搞定
2025-02-19 20:56:15
梁文锋等发表DeepSeek V3回顾性论文
2025-05-16 17:08:55
492 文章
72247 浏览
24小时热文
更多

-
2025-07-20 17:06:49
-
2025-07-20 16:05:44
-
2025-07-20 16:05:36