3月25日晚,DeepSeek宣布完成DeepSeek V3模型的小版本升级,版本号为DeepSeek-V3-0324。此次更新虽为小版本,但性能提升显著,尤其在前端开发、数学推理及上下文理解方面表现突出。据反馈,新版模型在数学与代码类任务中的表现超越GPT-4.5。此外,V3模型优化了HTML等代码生成的可用性和设计感,提升了中长篇中文写作的质量,并增强了联网搜索场景下的报告生成能力。该版本延续了DeepSeek-V3的基础模型架构,仅调整后训练方法,支持私有化部署时更新checkpoint与tokenizer_config.json文件。模型参数约660B,开源版本上下文长度达128K(网页端、App及API为64K)。DeepSeek-V3-0324同样采用MIT License,允许用户自由使用和再训练。
原文链接
本文链接:https://kx.umi6.com/article/16137.html
转载请注明文章出处
相关推荐
.png)
换一换
英伟达的最大空头出现了
2024-12-31 15:46:07
“AI小财神”推理能力全面升级 做投资者的“深度思考官”
2025-02-13 11:00:46
DeepSeek-V3首个版本上线
2024-12-27 08:58:12
468 文章
68784 浏览
24小时热文
更多

-
2025-07-19 15:54:36
-
2025-07-19 15:54:26
-
2025-07-19 14:57:21