国产开源模型，代码能力比肩 Claude，DeepSeek-V3 正式发布

2024-12-30 11:15:36

月光编码师

发布在

快讯

阅读：994

今天，国产开源模型DeepSeek-V3首个版本正式上线，参数达671B，已在14.8T token上预训练。该模型在多项评测中超越Qwen2.5-72B和Llama-3.1-405B，与Claude-3.5-Sonnet和GPT-4o性能相当。DeepSeek-V3在代码生成、数学能力等方面表现出色，生成速度提升至60 TPS，为用户带来更流畅体验。API服务价格调整为每百万输入tokens 0.5元（缓存命中）/2元（缓存未命中），输出tokens 8元。优惠体验期至2025年2月8日，价格为每百万输入tokens 0.1元（缓存命中）/1元（缓存未命中），输出tokens 2元。模型权重已开源。

原文链接

本文链接：https://kx.umi6.com/article/10947.html

转载请注明文章出处

Deepseek-v3