1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

1月12日晚,DeepSeek发布新论文《Conditional Memory via Scalable Lookup: A New Axis of Sparsity for Large Language Models》,作者包括北京大学与DeepSeek团队,署名中出现梁文锋。论文提出条件记忆(conditional memory)概念,通过引入可扩展查找记忆结构,在相同参数和算力下显著提升大型语言模型在知识调用、推理、代码及数学任务中的表现。同时,DeepSeek开源了相关记忆模块Engram,为研究社区提供重要资源。这一成果为AI模型稀疏性研究开辟了新方向,具有重要意义。

原文链接
本文链接:https://kx.umi6.com/article/31530.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
智谱创始人唐杰谈 DeepSeek:很震撼,开启了“AI 做事”新范式
2026-01-12 09:23:20
DeepSeek网页及API相关服务已恢复
2026-05-08 19:36:09
Deepseek官网公布deepseek-v4接口文档
2026-04-24 11:10:00
DeepSeek新大招曝光:下一步智能体
2025-09-05 10:15:28
DeepSeek的一次小更新:暴打OpenAI 追上Gemini
2025-12-03 00:44:54
美国AI巨头炮轰DeepSeek 只为给五角大楼递投名状
2026-02-26 07:32:42
北大团队改造DeepSeek注意力,速度快四倍还不丢精度
2026-04-07 00:20:16
DeepSeek网页版大升级!随后宕机11小时崩上热搜,新模型真的来了
2026-03-30 11:42:07
DeepSeek V4最大的遗憾
2026-05-03 12:19:12
DeepSeek发布Agent Harness相关岗位 或推智能体产品
2026-05-20 16:47:33
六大AI大模型展开美股投资竞赛:重仓英伟达的Deepseek再次领跑
2025-10-28 18:00:23
深度解析:DeepSeek不差钱,为什么还要融500亿?
2026-05-09 19:34:13
DeepSeek新论文剧透V4新框架!用闲置网卡加速智能体推理性能
2026-02-27 16:53:38
24小时热文
更多
扫一扫体验小程序