1月21日消息,DeepSeek计划于2月农历新年期间发布新一代旗舰AI模型DeepSeek V4,预计将具备更强的代码编写能力。1月20日,开发者发现DeepSeek在GitHub更新的代码中多次提到未知标识符“MODEL1”,可能代表全新架构。与现有模型“V32”相比,“MODEL1”在键值缓存布局、稀疏性处理及FP8解码支持等方面存在显著差异,表明新架构或优化内存与计算效率。此外,DeepSeek近期发布的两篇论文介绍“优化残差连接(mHC)”和“AI记忆模块(Engram)”,可能整合到新模型中。此前爆料称,DeepSeek V4的编程能力有望超越OpenAI GPT及Anthropic Claude。
原文链接
本文链接:https://kx.umi6.com/article/31947.html
转载请注明文章出处
相关推荐
换一换
DeepSeek母公司去年进账50亿,够烧2380个R1
2026-01-13 16:43:30
人民呼唤DeepSeek!
2025-07-16 12:02:16
六大AI拿1万美元真实交易:DeepSeek最能赚,GPT-5亏麻了,AI能让周杰伦少亏上亿
2025-10-20 17:12:32
DeepSeek 开源新模型 V3.1:约 685B 参数,上下文长度拓展至 128K
2025-08-20 10:11:16
DeepSeek 开年发布新论文:提出全新 mHC 架构,梁文锋现身作者名单
2026-01-01 17:23:53
DeepSeek 出现服务故障:网页 / API 性能异常,已进行修复
2025-11-25 16:59:50
梁文锋代表DeepSeek,他代表梁文锋
2025-11-16 12:31:32
deepseek关联公司公布大语言模型部署方法专利
2025-08-01 14:04:10
DeepSeek降本秘诀曝光:2招极致压榨推理部署,算力全留给内部
2025-07-04 15:46:17
DeepSeek对“王一博案”道歉?假新闻!
2025-07-03 23:32:06
DeepSeek“点燃”国产芯片 FP8能否引领行业新标准?
2025-08-24 11:14:54
DeepSeek推理最高提速6倍!开源研究:加装「思维进度条」,计算量减少30%
2025-07-08 14:44:52
DeepSeek昨天悄悄扔的炸弹,今天爆了
2025-08-22 17:51:00
631 文章
428848 浏览
24小时热文
更多
-
2026-01-21 16:20:44 -
2026-01-21 16:19:39 -
2026-01-21 16:18:32