8月1日,deepseek关联公司杭州深度求索人工智能基础技术研究有限公司公布了一项名为“一种大语言模型的部署方法及系统”的专利。该发明属于人工智能领域,通过将预填充阶段和解码阶段分别部署在高性能计算能力和大内存的机器上,实现负载均衡,最大化硬件利用率。此方法有效减少闲置算力,降低整体延迟,提升吞吐量,同时增强系统的扩展性和容错性,为大语言模型的高效部署提供了创新解决方案。
原文链接
本文链接:https://kx.umi6.com/article/22835.html
转载请注明文章出处
相关推荐
换一换
DeepSeek线上模型升级:当前版本号 DeepSeek-V3.1-Terminus
2025-09-22 21:05:30
鏖战2025年,大模型围着开源转
2025-12-25 18:55:44
DeepSeek:正测试新的长文本模型结构 支持1M上下文
2026-02-13 20:39:39
梁文锋,Nature全球年度十大科学人物!
2025-12-09 10:25:17
苹果创新“清单法”:用 AI 大模型当“老师”,教小模型更精准执行复杂指令
2025-08-26 07:38:55
DeepSeek连更GitHub,华尔街回想起被支配的恐惧:“DeepSeek第二时刻”要来了
2026-02-24 13:45:27
DeepSeek催化下,芯片带领沪指突破3800点
2025-08-22 20:52:41
清华刘知远团队论文:最小化结构改动,短文本到长文本丝滑升级 | ICLR 2026
2026-02-06 20:12:11
deepseek当选网易有道词典2025年度词汇,全年搜索量超867万次
2025-12-01 18:22:41
Transformer作者:DeepSeek才有搞头,OpenAI指望不上了
2025-09-12 11:09:05
DeepSeek 新模型曝光:MODEL1 代码预示新架构,最快有望 2 月发布
2026-01-21 09:02:53
DeepSeek“点燃”国产芯片 FP8能否引领行业新标准?
2025-08-24 11:14:54
中国大模型首登Nature封面!DeepSeek首次披露:R1训练只花200万
2025-09-18 13:51:50
773 文章
592096 浏览
24小时热文
更多
-
2026-04-21 20:21:17 -
2026-04-21 19:22:52 -
2026-04-21 19:21:47