DeepSeek V3小版本大升级：推理、前端开发加强这些能力超越GPT-4.5

2025-03-25 23:20:38

小阳哥

发布在

快讯

阅读：755

3月25日晚，DeepSeek宣布完成DeepSeek V3模型的小版本升级，版本号为DeepSeek-V3-0324。此次更新虽为小版本，但性能提升显著，尤其在前端开发、数学推理及上下文理解方面表现突出。据反馈，新版模型在数学与代码类任务中的表现超越GPT-4.5。此外，V3模型优化了HTML等代码生成的可用性和设计感，提升了中长篇中文写作的质量，并增强了联网搜索场景下的报告生成能力。该版本延续了DeepSeek-V3的基础模型架构，仅调整后训练方法，支持私有化部署时更新checkpoint与tokenizer_config.json文件。模型参数约660B，开源版本上下文长度达128K（网页端、App及API为64K）。DeepSeek-V3-0324同样采用MIT License，允许用户自由使用和再训练。

原文链接

本文链接：https://kx.umi6.com/article/16137.html

转载请注明文章出处

Deepseek-v3