DeepSeek V3,一个参数量达6710亿的AI模型,于近期正式开源。相比Llama 3.1 405B,DeepSeek V3不仅在评测中达到开源SOTA,还能与GPT-4o和Claude 3.5 Sonnet等顶级模型相媲美,且价格仅为后者的1/53。更令人惊叹的是,DeepSeek V3仅需不到280万个GPU小时的训练时间,相比Llama 3.1的3080万GPU小时,大幅降低了成本。DeepSeek V3的API价格也极具竞争力,每百万输入tokens只需0.5元(缓存命中)/2元(缓存未命中),每百万输出tokens 8元。此外,DeepSeek V3支持FP8权重的原生开源,并提供FP8到BF16的转换脚本。DeepSeek团队的技术成就得到了多位专家的认可,包括OpenAI创始成员Karpathy和Meta科学家田渊栋。DeepSeek V3现已开放体验,官网为。
原文链接
本文链接:https://kx.umi6.com/article/10855.html
转载请注明文章出处
相关推荐
换一换
智谱视觉推理模型 GLM-4.5V 上线并开源,号称“全球 100B 级效果最佳”
2025-08-11 23:10:30
腾讯发布混元3D世界模型1.0:首个支持物理仿真的开源世界生成系统
2025-08-01 09:00:10
X 平台正式开源推荐算法,马斯克称没有其他社交媒体公司这样做
2026-01-20 14:10:44
北京人形开源最新VLM模型,推动具身智能再迈关键一步 !
2025-11-14 13:57:27
美团视频生成模型正式发布并开源
2025-10-27 11:00:45
抖音&LV-NUS开源多模态新模,以小博大刷新SOTA,8B推理比肩GPT-4o
2025-10-14 12:13:47
小米首席语音科学家 Daniel Povey:AI 发展的本质就像生物进化,不开源要慢 1000 倍
2025-12-15 16:49:04
Kimi即将推出新一代万亿大模型:开源王者刷新 去年已超GPT5
2026-01-20 22:33:50
阿里开源视觉理解模型Qwen3-VL
2025-09-24 14:43:41
李开复:如果十年后回顾 DeepSeek 如何让中国未落后美国,答案是开源
2025-09-27 12:40:23
阶跃星辰全面开源 Step 3.5 Flash:预训练+训练框架全放出 冲上 OpenClaw Top2
2026-03-04 10:34:06
腾讯混元开源翻译模型 1.5:手机 1GB 内存即可运行,效果超越商用 API
2025-12-30 16:27:33
腾讯混元OCR模型宣布开源
2025-11-25 15:00:37
729 文章
622236 浏览
24小时热文
更多
-
2026-04-24 20:31:56 -
2026-04-24 20:29:51 -
2026-04-24 19:29:38