1月21日消息,DeepSeek计划于2月农历新年期间发布新一代旗舰AI模型DeepSeek V4,预计将具备更强的代码编写能力。1月20日,开发者发现DeepSeek在GitHub更新的代码中多次提到未知标识符“MODEL1”,可能代表全新架构。与现有模型“V32”相比,“MODEL1”在键值缓存布局、稀疏性处理及FP8解码支持等方面存在显著差异,表明新架构或优化内存与计算效率。此外,DeepSeek近期发布的两篇论文介绍“优化残差连接(mHC)”和“AI记忆模块(Engram)”,可能整合到新模型中。此前爆料称,DeepSeek V4的编程能力有望超越OpenAI GPT及Anthropic Claude。
原文链接
本文链接:https://kx.umi6.com/article/31947.html
转载请注明文章出处
相关推荐
换一换
美称中国一人工智能企业违反美出口管制 外交部:中方已多次表明原则立场
2026-02-24 15:53:46
性能至少翻倍 DeepSeek官宣支持下一代国产AI芯片
2025-08-21 19:40:24
美国AI巨头炮轰DeepSeek 只为给五角大楼递投名状
2026-02-26 07:32:42
黄仁勋力赞 DeepSeek,称中国创新的步伐不可能被阻挡
2025-07-21 09:13:49
中国大模型首登Nature封面!DeepSeek首次披露:R1训练只花200万
2025-09-18 13:51:50
被曝蒸馏DeepSeek还造假!欧版OpenAI塌方了
2025-08-14 16:57:45
DeepSeek 新模型曝光:MODEL1 代码预示新架构,最快有望 2 月发布
2026-01-21 09:02:53
DeepSeek官方点赞元宝,罕见现身互动
2025-12-24 17:46:41
六大AI大模型展开美股投资竞赛:重仓英伟达的Deepseek再次领跑
2025-10-28 18:00:23
黄仁勋力赞DeepSeek 对中国创新能力充满信心
2025-07-21 04:12:05
DeepSeek新模型上线
2025-09-30 11:25:43
超 346 款生成式 AI 完成备案:DeepSeek 上线 20 天全球日活跃用户即突破 3000 万
2025-07-21 11:16:03
DeepSeek:已在平台内对 AI 生成合成内容添加标识,用户不得恶意删除
2025-09-01 18:24:35
664 文章
479249 浏览
24小时热文
更多
-
2026-03-11 20:36:13 -
2026-03-11 20:35:03 -
2026-03-11 19:30:48