1月21日,DeepSeek在GitHub更新deepseek-ai/FlashMLA仓库,新增一个未公开模型架构标识“MODEL1”,被提及31次。MODEL1是DeepSeek FlashMLA支持的两大核心模型之一,另一为DeepSeek-V3.2。推测MODEL1为高效推理模型,内存占用低于V3.2,适合边缘设备或成本敏感场景,也可能针对16K+长序列优化,适用于文档理解、代码分析等任务。此次更新涉及114个代码文件,涵盖多种格式。(腾讯科技)
原文链接
本文链接:https://kx.umi6.com/article/31958.html
转载请注明文章出处
相关推荐
换一换
DeepSeek:正测试新的长文本模型结构 支持1M上下文
2026-02-13 20:39:39
DeepSeek注册资本提高50%
2026-04-28 09:06:54
DeepSeek昨天悄悄扔的炸弹,今天爆了
2025-08-22 17:51:00
DeepSeek发布新论文提出更为高效的AI开发方法
2026-01-02 18:32:56
所有实验室都怕字节,所有人都在夸DeepSeek!美国研究员36小时中国AI行
2026-05-08 13:17:18
性能至少翻倍 DeepSeek官宣支持下一代国产AI芯片
2025-08-21 19:40:24
不是接入DeepSeek,就叫AI制药
2026-01-17 16:35:32
DeepSeek据悉拟募资最高500亿元人民币
2026-05-08 21:41:39
DeepSeek深夜更新后自曝:我是V4(?!)
2026-04-08 12:51:42
DeepSeek V4价格打骨折,宁王京东网易抢着入场,梁文锋:目标是AGI
2026-05-23 18:53:19
DeepSeek新模型上线!引入DSA新稀疏注意力,还又狙了CUDA一枪
2025-09-29 19:13:01
DeepSeek发布Agent Harness相关岗位 或推智能体产品
2026-05-20 16:47:33
六大AI模型被扔进加密市场厮杀,DeepSeek暂为交易之王
2025-10-20 18:12:39
770 文章
686424 浏览
24小时热文
更多
-
2026-06-09 00:54:40 -
2026-06-09 00:53:08 -
2026-06-08 23:49:41