1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

正文:2026年2月,DeepSeek联合北大、清华在ArXiv发布论文,推出全新智能体推理框架DualPath。该框架通过引入存储至解码引擎的第二条路径,利用闲置网卡带宽优化KV-Cache加载,缓解长文本推理中的I/O瓶颈。实测显示,DualPath将660B规模模型的离线推理吞吐量提升1.87倍,在线服务吞吐量平均提升1.96倍,同时显著降低首字延迟(TTFT)。研究由北大博士生吴永彤主导,其研究方向为大模型基础设施与推理系统优化。

原文链接
本文链接:https://kx.umi6.com/article/33274.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
DeepSeek 输入缓存降价
2026-04-26 23:42:34
DeepSeek被曝开发AI智能体模型:能自主完成多步工作
2025-09-05 08:15:12
DeepSeek 开年发布新论文:提出全新 mHC 架构,梁文锋现身作者名单
2026-01-01 17:23:53
DeepSeek:已在平台内对 AI 生成合成内容添加标识,用户不得恶意删除
2025-09-01 18:24:35
鏖战2025年,大模型围着开源转
2025-12-25 18:55:44
DeepSeek 声明:防范冒用“深度求索”名义实施诈骗
2025-09-18 12:52:40
腾讯与阿里巴巴洽谈投资DeepSeek 估值超过200亿美元
2026-04-22 19:27:03
QuestMobile 报告:豆包月活超越 DeepSeek,夺 8 月中国原生 AI App 月活第一
2025-09-16 18:17:35
DeepSeek据悉拟募资最高500亿元人民币
2026-05-08 21:41:39
梁文锋代表DeepSeek,他代表梁文锋
2025-11-16 12:31:32
DeepSeek又一论文上新
2026-02-27 15:54:06
DeepSeek陈德里开发自动研究Skill,写一篇论文人类只动脑2小时
2026-05-27 10:20:09
DeepSeek等开源模型,更“浪费”token吗?
2025-10-11 10:17:13
24小时热文
更多
扫一扫体验小程序