DeepSeek 新模型曝光：MODEL1 代码预示新架构，最快有望 2 月发布

2026-01-21 09:02:53

蝶舞CyberSwirl

发布在

快讯

阅读：622

1月21日消息，DeepSeek计划于2月农历新年期间发布新一代旗舰AI模型DeepSeek V4，预计将具备更强的代码编写能力。1月20日，开发者发现DeepSeek在GitHub更新的代码中多次提到未知标识符“MODEL1”，可能代表全新架构。与现有模型“V32”相比，“MODEL1”在键值缓存布局、稀疏性处理及FP8解码支持等方面存在显著差异，表明新架构或优化内存与计算效率。此外，DeepSeek近期发布的两篇论文介绍“优化残差连接（mHC）”和“AI记忆模块（Engram）”，可能整合到新模型中。此前爆料称，DeepSeek V4的编程能力有望超越OpenAI GPT及Anthropic Claude。

原文链接

本文链接：https://kx.umi6.com/article/31947.html

转载请注明文章出处

DeepSeek