8月1日,deepseek关联公司杭州深度求索人工智能基础技术研究有限公司公布了一项名为“一种大语言模型的部署方法及系统”的专利。该发明属于人工智能领域,通过将预填充阶段和解码阶段分别部署在高性能计算能力和大内存的机器上,实现负载均衡,最大化硬件利用率。此方法有效减少闲置算力,降低整体延迟,提升吞吐量,同时增强系统的扩展性和容错性,为大语言模型的高效部署提供了创新解决方案。
原文链接
本文链接:https://kx.umi6.com/article/22835.html
转载请注明文章出处
相关推荐
换一换
OpenAI 被曝正开发全新 AI 大语言模型:代号“大蒜”,性能超越谷歌 Gemini 3
2025-12-03 00:43:57
六大AI模型被扔进加密市场厮杀,DeepSeek暂为交易之王
2025-10-20 18:12:39
Meta人事巨震、AI教母站台 通往AGI之路遇上分岔路口
2025-11-15 10:46:28
DeepSeek 新模型曝光:MODEL1 代码预示新架构,最快有望 2 月发布
2026-01-21 09:02:53
DeepSeek专家模式上线!深度思考+极速Token 复杂难题一键搞定
2026-04-08 10:49:12
被315点名的万亿隐秘生意:“污染”DeepSeek
2026-03-16 18:20:37
六大AI拿1万美元真实交易:DeepSeek最能赚,GPT-5亏麻了,AI能让周杰伦少亏上亿
2025-10-20 17:12:32
DeepSeek据悉拟募资最高500亿元人民币
2026-05-08 21:41:39
美称中国一人工智能企业违反美出口管制 外交部:中方已多次表明原则立场
2026-02-24 15:53:46
北大团队改造DeepSeek注意力,速度快四倍还不丢精度
2026-04-07 00:20:16
苹果新研究:AI 不听录音,凭文本描述能零样本识别洗碗等 12 种活动
2025-11-22 08:06:08
之江实验室薛贵荣:当AI开始做科研,我看到了大语言模型的天花板丨GAIR 2025
2025-12-31 17:32:07
DeepSeek发布两款新模型
2025-12-01 19:31:03
806 文章
690811 浏览
24小时热文
更多
-
2026-06-08 21:46:02 -
2026-06-08 19:42:13 -
2026-06-08 19:40:56