1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

DeepSeek V3,一个参数量达6710亿的AI模型,于近期正式开源。相比Llama 3.1 405B,DeepSeek V3不仅在评测中达到开源SOTA,还能与GPT-4o和Claude 3.5 Sonnet等顶级模型相媲美,且价格仅为后者的1/53。更令人惊叹的是,DeepSeek V3仅需不到280万个GPU小时的训练时间,相比Llama 3.1的3080万GPU小时,大幅降低了成本。DeepSeek V3的API价格也极具竞争力,每百万输入tokens只需0.5元(缓存命中)/2元(缓存未命中),每百万输出tokens 8元。此外,DeepSeek V3支持FP8权重的原生开源,并提供FP8到BF16的转换脚本。DeepSeek团队的技术成就得到了多位专家的认可,包括OpenAI创始成员Karpathy和Meta科学家田渊栋。DeepSeek V3现已开放体验,官网为。

原文链接
本文链接:https://kx.umi6.com/article/10855.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
不玩噱头的北京,用数据和实力成就「全球开源之都」
2025-05-20 20:44:53
腾讯发布混元3D世界模型1.0:首个支持物理仿真的开源世界生成系统
2025-08-01 09:00:10
字节 Seed 开源统一多模态理解和生成模型 BAGEL
2025-06-03 19:01:17
智谱视觉推理模型 GLM-4.5V 上线并开源,号称“全球 100B 级效果最佳”
2025-08-11 23:10:30
百度正式开源文心大模型 4.5 系列模型
2025-06-30 11:41:55
鹅厂开源视频生成大杀器!参考图主体精准复刻,还能编辑现有视频
2025-05-09 21:57:02
小米多模态大模型 MiMo-VL 开源,官方称多方面领先 Qwen2.5-VL-7B
2025-05-30 16:57:55
开源版Genie3世界模型来了:实时+长时间交互,单卡可跑,国内公司出品
2025-08-19 10:59:13
全球首款AI 多人游戏来了,你的老电脑也能玩
2025-05-09 18:56:07
阿里云通义千问开源 Qwen3-VL-30B-A3B 模型:智能体任务等领域媲美 GPT-5-Mini
2025-10-04 14:01:20
昆仑万维发布并开源Matrix-Game 2.0模型
2025-08-12 10:17:03
DeepSeek终于丢了开源第一王座,但继任者依然来自中国
2025-07-18 17:42:26
行业首个 100% 开源的企业级智能体,京东云开源 JoyAgent
2025-07-26 11:37:17
24小时热文
更多
扫一扫体验小程序