deepseek关联公司公布大语言模型部署方法专利

2025-08-01 14:04:10

小阳哥

发布在

快讯

阅读：1021

8月1日，deepseek关联公司杭州深度求索人工智能基础技术研究有限公司公布了一项名为“一种大语言模型的部署方法及系统”的专利。该发明属于人工智能领域，通过将预填充阶段和解码阶段分别部署在高性能计算能力和大内存的机器上，实现负载均衡，最大化硬件利用率。此方法有效减少闲置算力，降低整体延迟，提升吞吐量，同时增强系统的扩展性和容错性，为大语言模型的高效部署提供了创新解决方案。

原文链接

本文链接：https://kx.umi6.com/article/22835.html

转载请注明文章出处

DeepSeek