1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:算力门槛下降是一连串事件

近日,杭州深度求索人工智能基础技术研究有限公司发布全新模型DeepSeek-V3,其在多项知识任务上表现优异,生成速度大幅提升至60TPS,成本仅为同类模型Llama 3的二十分之一。DeepSeek-V3的训练仅使用了278.8万个H800 GPU小时,总成本557.6万美元,远低于Llama 3的3930万H100 GPU小时。

DeepSeek-V3不仅训练成本低,使用成本也仅为竞争对手的十分之一。模型API服务价格为每百万输入词元0.15美元,输出词元0.3美元,而GPT-o1和Claude-3.5-Sonnet的价格分别是每百万输入词元2.5美元和3美元,输出词元10美元和15美元。

DeepSeek-V3的成功在于采用了“混合专家模型”(MoE)架构,将任务分解为多个“专家”模型,大幅降低了训练成本。然而,MoE模型存在通用性差的问题,对协调系统的依赖较高。

算力门槛的降低可能不会减少AI行业的总需求,反而可能增加。一方面,训练模型的算力减少会促使更多算力资源转用于推理端,另一方面,更多企业可能进入市场,推动更多模型的开发和使用。此外,模型使用成本的下降也可能吸引更多用户采用大模型,进一步推动算力需求的增长。

DeepSeek-V3的成功可能改变AI市场的竞争格局。基础支持层的格局可能发生变化,英伟达的市场地位可能被削弱。基础模型市场也可能重新变得激烈,新的“颠覆式创新”可能出现。AI应用市场可能因此更加繁荣,推动整个AI市场的良性循环。

原文链接
本文链接:https://kx.umi6.com/article/11312.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
DeepSeek-V3深夜惊爆上新!代码数学飙升剑指GPT-5,一台Mac可跑
2025-05-05 09:34:07
免费的「网页版Cursor」!新版DeepSeek-V3加持,秒秒钟编出APP
2025-04-01 13:26:23
华尔街多头分析师“嘴硬”表态:DeepSeek的创新不是算力利空
2025-01-28 01:39:42
大模型性价比之王来了!训练2个月、花费558万美元 性能匹敌GPT-4o
2024-12-27 14:07:00
DeepSeek-V3横空出世,浙江私募力量震惊硅谷
2025-01-18 19:38:08
省钱也是技术活:解密DeepSeek的极致压榨术
2025-01-23 16:22:07
AMD:已将新的DeepSeek-V3模型集成到Instinct MI300X GPU上
2025-01-25 18:04:42
DeepSeek-V3低调发布后 业内震惊之余再次怀疑硅谷模式
2025-03-25 12:55:22
AI降本增效成最大骗局!算力成本远超员工工资
2026-05-24 18:51:14
DeepSeek-V3:美国芯片封锁的“意外”产物?
2025-01-06 10:21:20
DeepSeek甩出了一张“王炸”
2024-12-28 15:30:07
DeepSeek算力需求暴降,为什么全球算力竞赛反而更疯狂了?
2025-02-17 15:56:46
国产大模型 DeepSeek-V3 开源:6710 亿参数自研 MoE,性能和 GPT-4o 不分伯仲
2024-12-27 08:55:04
24小时热文
更多
扫一扫体验小程序