今天,国产开源模型DeepSeek-V3首个版本正式上线,参数达671B,已在14.8T token上预训练。该模型在多项评测中超越Qwen2.5-72B和Llama-3.1-405B,与Claude-3.5-Sonnet和GPT-4o性能相当。DeepSeek-V3在代码生成、数学能力等方面表现出色,生成速度提升至60 TPS,为用户带来更流畅体验。API服务价格调整为每百万输入tokens 0.5元(缓存命中)/2元(缓存未命中),输出tokens 8元。优惠体验期至2025年2月8日,价格为每百万输入tokens 0.1元(缓存命中)/1元(缓存未命中),输出tokens 2元。模型权重已开源。
原文链接
本文链接:https://kx.umi6.com/article/10947.html
转载请注明文章出处
相关推荐
.png)
换一换
DeepSeek V3小版本大升级:推理、前端开发加强 这些能力超越GPT-4.5
2025-03-25 23:20:38
最强3B「小钢炮」,代码数据全公开!推理随意开关,128k超长上下文
2025-07-11 11:34:58
爆火的DeepSeek-V3强在哪?
2024-12-29 15:55:20
407 文章
62904 浏览
24小时热文
更多

-
2025-07-19 15:54:36
-
2025-07-19 15:54:26
-
2025-07-19 14:57:21