标题:英伟达面临强劲对手:DeepSeek-V3
神秘的东方力量再次震惊世界,这次是大模型。12月26日,幻方量化旗下的DeepSeek发布新一代开源大模型DeepSeek-V3,该模型参数量高达671B,仅用2048块GPU训练2个月,总成本557.6万美元。这意味着DeepSeek-V3的训练成本仅为GPT-4o的二十分之一。
在性能方面,DeepSeek-V3在多个任务上表现优异,甚至超越其他开源大模型,与GPT-4o和Claude 3.5 Sonnet相比也毫不逊色。广发证券分析称,DeepSeek-V3的算力成本降低得益于DeepSeekMoE和MLA架构的优化。
DeepSeek不仅是大模型价格战的最早发起者,还提供了史无前例的性价比。在定价上,DeepSeek-V3 API每百万tokens输入费用为0.5元(缓存命中)/2元(缓存未命中),输出费用为8元,性价比较高。
DeepSeek由知名量化私募幻方量化创立,拥有强大的算力储备。幻方量化创始人梁文锋表示,他们致力于推动技术前沿,降低成本,使AI普惠大众。
原文链接
本文链接:https://kx.umi6.com/article/11045.html
转载请注明文章出处
相关推荐
.png)
换一换
对话宇树科技王兴兴:人形机器人,没有大家想象的那么复杂
2025-02-18 17:21:59
DeepSeek-V3 模型完成小版本升级,已可试用体验
2025-03-24 22:18:43
AI大模型看手相!图片视频加持深度思考,阿里QVQ-Max“神了神了”
2025-03-28 12:42:34
阿里云 PAI 支持云上一键部署 DeepSeek-V3、DeepSeek-R1 系列模型
2025-02-07 23:07:43
国内最早的AI大模型公司已经开始亏损了
2025-04-28 08:44:59
DeepSeek-V3深夜惊爆上新!代码数学飙升剑指GPT-5,一台Mac可跑
2025-05-05 09:34:07
DeepSeek 官方详解 V3 模型小版本升级:各项能力全面进阶
2025-03-25 22:18:23
Anthropic天价赔款?大模型“盗版”的100000种花样
2025-08-15 10:14:50
中国信通院启动 AI 大模型幻觉评测,总体涉及五种测试维度
2025-03-19 17:41:04
首次披露!DeepSeek V3 发布软硬一体协同训练论文,公开“降成本”秘诀
2025-05-16 14:52:41
面壁智能获新一轮数亿元融资,贵州茅台酒旗下基金、国中资本等出资
2025-05-21 10:03:05
中国AI大模型APP月活TOP10出炉:DeepSeek第一 1.8亿遥遥领先
2025-03-26 08:42:06
全国首个罕见病领域 AI 大模型“协和・太初”发布,可进一步缩短确诊时间
2025-02-20 15:17:38
551 文章
186052 浏览
24小时热文
更多

-
2025-09-06 11:36:18
-
2025-09-06 11:35:08
-
2025-09-06 11:33:57