1月21日,DeepSeek在GitHub更新deepseek-ai/FlashMLA仓库,新增一个未公开模型架构标识“MODEL1”,被提及31次。MODEL1是DeepSeek FlashMLA支持的两大核心模型之一,另一为DeepSeek-V3.2。推测MODEL1为高效推理模型,内存占用低于V3.2,适合边缘设备或成本敏感场景,也可能针对16K+长序列优化,适用于文档理解、代码分析等任务。此次更新涉及114个代码文件,涵盖多种格式。(腾讯科技)
原文链接
本文链接:https://kx.umi6.com/article/31958.html
转载请注明文章出处
相关推荐
换一换
在史上最大规模WAIC中寻找DeepSeek
2025-07-28 09:10:59
GPT-5之后,奥特曼向左,梁文锋向右
2025-08-15 17:17:56
DeepSeek 通知线上模型版本升级至 V3.1,上下文长度拓展至 128k
2025-08-19 21:05:45
没有商业模式,是DeepSeek最坚固的「护城河」
2026-01-21 14:10:41
DeepSeek“点燃”国产芯片 FP8能否引领行业新标准?
2025-08-24 11:14:54
DeepSeek新大招曝光:下一步智能体
2025-09-05 10:15:28
DeepSeek官方点赞元宝,罕见现身互动
2025-12-24 17:46:41
淘宝上卖9块9的DeepSeek,让我看到了被折叠的魔幻世界
2025-09-16 12:10:49
DeepSeek首登《自然》封面:中国大模型创造新历史,做了OpenAI不敢做的事
2025-09-18 16:58:59
被曝蒸馏DeepSeek还造假!欧版OpenAI塌方了
2025-08-14 16:57:45
梁文锋,准备战斗
2025-07-30 17:51:33
DeepSeek更新GitHub仓库 新模型“MODEL1”曝光
2026-01-21 11:03:39
出圈一周年,DeepSeek的变与不变
2026-01-16 15:50:22
705 文章
500366 浏览
24小时热文
更多
-
2026-03-11 21:39:14 -
2026-03-11 20:36:13 -
2026-03-11 20:35:03