正文:2026年2月,DeepSeek联合北大、清华在ArXiv发布论文,推出全新智能体推理框架DualPath。该框架通过引入存储至解码引擎的第二条路径,利用闲置网卡带宽优化KV-Cache加载,缓解长文本推理中的I/O瓶颈。实测显示,DualPath将660B规模模型的离线推理吞吐量提升1.87倍,在线服务吞吐量平均提升1.96倍,同时显著降低首字延迟(TTFT)。研究由北大博士生吴永彤主导,其研究方向为大模型基础设施与推理系统优化。
原文链接
本文链接:https://kx.umi6.com/article/33274.html
转载请注明文章出处
相关推荐
换一换
超 346 款生成式 AI 完成备案:DeepSeek 上线 20 天全球日活跃用户即突破 3000 万
2025-07-21 11:16:03
李开复:如果十年后回顾 DeepSeek 如何让中国未落后美国,答案是开源
2025-09-27 12:40:23
梁文锋代表DeepSeek,他代表梁文锋
2025-11-16 12:31:32
DeepSeek被曝开发AI智能体模型:能自主完成多步工作
2025-09-05 08:15:12
黄仁勋力赞DeepSeek 对中国创新能力充满信心
2025-07-21 04:12:05
DeepSeek成了硅谷最大的“不能说的秘密”
2025-09-23 17:20:46
网友称“Deepseek演都不演了”:输入手机内存不够“二选一删谁” 秒回答豆包
2025-08-20 17:26:16
智能车轮碾过,在2025留下十道车辙
2025-12-30 15:26:18
DeepSeek终于把OpenAI逼急了
2025-08-06 16:35:39
deepseek关联公司公布大语言模型部署方法专利
2025-08-01 14:04:10
DeepSeek线上模型升级:当前版本号 DeepSeek-V3.1-Terminus
2025-09-22 21:05:30
deepseek当选网易有道词典2025年度词汇,全年搜索量超867万次
2025-12-01 18:22:41
消息称 DeepSeek 正开发更先进模型:具备 AI 智能体能力,剑指年底发布
2025-09-04 18:07:12
658 文章
521860 浏览
24小时热文
更多
-
2026-04-22 22:32:08 -
2026-04-22 21:32:58 -
2026-04-22 21:31:52