1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:英伟达面临强劲对手:DeepSeek-V3

神秘的东方力量再次震惊世界,这次是大模型。12月26日,幻方量化旗下的DeepSeek发布新一代开源大模型DeepSeek-V3,该模型参数量高达671B,仅用2048块GPU训练2个月,总成本557.6万美元。这意味着DeepSeek-V3的训练成本仅为GPT-4o的二十分之一。

在性能方面,DeepSeek-V3在多个任务上表现优异,甚至超越其他开源大模型,与GPT-4o和Claude 3.5 Sonnet相比也毫不逊色。广发证券分析称,DeepSeek-V3的算力成本降低得益于DeepSeekMoE和MLA架构的优化。

DeepSeek不仅是大模型价格战的最早发起者,还提供了史无前例的性价比。在定价上,DeepSeek-V3 API每百万tokens输入费用为0.5元(缓存命中)/2元(缓存未命中),输出费用为8元,性价比较高。

DeepSeek由知名量化私募幻方量化创立,拥有强大的算力储备。幻方量化创始人梁文锋表示,他们致力于推动技术前沿,降低成本,使AI普惠大众。

原文链接
本文链接:https://kx.umi6.com/article/11045.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
六大国产大模型,谁是最强「金融分析师」?
2025-07-21 17:21:44
AI大模型引爆银发经济:12万亿市场重构进行时
2025-03-21 11:19:20
首届 AI 大模型真实投资比赛 Alpha Arena 落幕,阿里通义千问 Qwen3-Max 以 22.32% 收益率夺冠
2025-11-04 12:11:27
一天内海外AI大模型接连上新 还有“重大发布”蓄势待发
2025-08-06 12:33:38
我国水利标准 AI 大模型正式发布,采用海量知识库 + DeepSeek / Qwen 双模型
2025-06-03 10:52:19
AI+能源掀起行业变革,蚂蚁数科能源电力时序大模型EnergyTS正式发布
2025-03-26 18:03:00
美的副总裁王建国:未来三年计划投入 500 亿元以上布局 AI 大模型
2025-07-09 12:03:02
多家金融与资管机构发力AI大模型运用,核心场景集中于投研支持
2025-03-13 14:25:27
当虹科技发布BlackEye 2.0 多模态空间大模型 与阿里云合作打造自主可控AI大模型解决方案
2025-09-19 17:21:37
中国自主量子计算机“本源悟空”全球首次运行十亿级 AI 微调大模型
2025-04-07 09:48:23
世纪华通总裁谢斐:AI大模型具有“平均化”特点 易导致内容趋同
2025-08-01 09:21:49
AI大模型上天了!中国科学院全新研究成果打破美国太空技术领先地位
2025-05-12 13:33:12
当智能变成平的
2025-02-28 09:02:36
24小时热文
更多
扫一扫体验小程序