1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

1月12日晚,DeepSeek发布新论文《Conditional Memory via Scalable Lookup: A New Axis of Sparsity for Large Language Models》,作者包括北京大学与DeepSeek团队,署名中出现梁文锋。论文提出条件记忆(conditional memory)概念,通过引入可扩展查找记忆结构,在相同参数和算力下显著提升大型语言模型在知识调用、推理、代码及数学任务中的表现。同时,DeepSeek开源了相关记忆模块Engram,为研究社区提供重要资源。这一成果为AI模型稀疏性研究开辟了新方向,具有重要意义。

原文链接
本文链接:https://kx.umi6.com/article/31530.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
Transformer作者:DeepSeek才有搞头,OpenAI指望不上了
2025-09-12 11:09:05
消息称 DeepSeek 正开发更先进模型:具备 AI 智能体能力,剑指年底发布
2025-09-04 18:07:12
Similarweb 报告 13 日全球 AI 流量:Gemini 成 ChatGPT 最强劲对手,DeepSeek 正收复失地
2025-11-15 12:48:52
AI实盘操作,DeepSeek暴赚,Gemini崩盘,网友:专业对口就是不一样
2025-10-20 21:13:47
DeepSeek网页版大升级!随后宕机11小时崩上热搜,新模型真的来了
2026-03-30 11:42:07
DeepSeek官方点赞元宝,罕见现身互动
2025-12-24 17:46:41
DeepSeek等开源模型,更“浪费”token吗?
2025-10-11 10:17:13
DeepSeek大量招人,该梁文锋上场了
2026-01-16 15:41:13
大厂抢郭达雅进行时!DeepSeek核心成员还是个“综艺巨佬”
2026-03-22 15:52:37
DeepSeek连更GitHub,华尔街回想起被支配的恐惧:“DeepSeek第二时刻”要来了
2026-02-24 13:45:27
北大团队改造DeepSeek注意力,速度快四倍还不丢精度
2026-04-07 00:20:16
DeepSeek大量招人,该梁文锋上场了
2026-01-16 15:41:13
出圈一周年,DeepSeek的变与不变
2026-01-16 15:50:22
24小时热文
更多
扫一扫体验小程序