标题:英伟达面临强劲对手:DeepSeek-V3
神秘的东方力量再次震惊世界,这次是大模型。12月26日,幻方量化旗下的DeepSeek发布新一代开源大模型DeepSeek-V3,该模型参数量高达671B,仅用2048块GPU训练2个月,总成本557.6万美元。这意味着DeepSeek-V3的训练成本仅为GPT-4o的二十分之一。
在性能方面,DeepSeek-V3在多个任务上表现优异,甚至超越其他开源大模型,与GPT-4o和Claude 3.5 Sonnet相比也毫不逊色。广发证券分析称,DeepSeek-V3的算力成本降低得益于DeepSeekMoE和MLA架构的优化。
DeepSeek不仅是大模型价格战的最早发起者,还提供了史无前例的性价比。在定价上,DeepSeek-V3 API每百万tokens输入费用为0.5元(缓存命中)/2元(缓存未命中),输出费用为8元,性价比较高。
DeepSeek由知名量化私募幻方量化创立,拥有强大的算力储备。幻方量化创始人梁文锋表示,他们致力于推动技术前沿,降低成本,使AI普惠大众。
原文链接
本文链接:https://kx.umi6.com/article/11045.html
转载请注明文章出处
相关推荐
换一换
涉嫌使用盗版成人影片训练AI大模型:Meta遭起诉索赔3.59亿美元
2025-08-22 15:51:07
中国AI大模型APP月活TOP10出炉:DeepSeek第一 1.8亿遥遥领先
2025-03-26 08:42:06
后DeepSeek时代:六小虎向左,BAT向右
2025-03-27 15:52:21
绝味食品:与腾讯智慧零售联合发布零售连锁AI大模型
2025-04-15 13:31:10
梁文锋署名DeepSeek新论文:公开V3大模型降本方法
2025-05-16 13:44:22
AI大模型上天了!中国科学院全新研究成果打破美国太空技术领先地位
2025-05-12 13:33:12
DeepSeek又更新了!化身更强AI设计师、程序员 比肩全球最强代码生成器?
2025-03-25 09:48:08
全球首个体重管理 AI 大模型“减单”在合肥发布
2025-03-24 08:47:05
AI 大模型创业,悄悄盯上年轻人最爱的「谷子经济」
2025-03-27 10:43:54
晶圆级芯片,是未来
2025-06-30 15:45:41
消息称字节为 Seed 部门 AI 大模型技术员工发放期权津贴,每月最高价值 13.5 万元
2025-09-05 00:09:19
当虹科技发布BlackEye 2.0 多模态空间大模型 与阿里云合作打造自主可控AI大模型解决方案
2025-09-19 17:21:37
全国首个罕见病领域 AI 大模型“协和・太初”发布,可进一步缩短确诊时间
2025-02-20 15:17:38
603 文章
277437 浏览
24小时热文
更多
-
2025-10-26 00:45:16 -
2025-10-25 23:44:04 -
2025-10-25 22:43:52