清华大学KVCache.AI团队与趋境科技联合发布的KTransformers开源项目取得重大进展,成功在RTX 4090单卡上实现DeepSeek-R1满血运行,解决了大模型本地部署难题。该项目于2月10日成功运行DeepSeek-R1、V3的671B满血版,速度提高3~28倍。KTransformers不仅支持DeepSeek模型,还兼容各类MoE模型,预处理速度最高达286 tokens/s,推理生成速度达14 tokens/s。此技术有望降低AI大模型的运行成本,使其更加普及。
原文链接
本文链接:https://kx.umi6.com/article/13467.html
转载请注明文章出处
相关推荐
.png)
换一换
4090单卡跑满血版DeepSeek-R1,清华团队开源项目再破大模型推理门槛
2025-02-12 13:26:11
京东云全面上线 DeepSeek-R1 / V3 模型,支持公有云在线部署、专混私有化实例部署
2025-02-05 12:02:10
DeepSeek-R1 最新发布,剑指 OpenAI o1
2025-01-22 10:55:31
468 文章
68841 浏览
24小时热文
更多

-
2025-07-20 17:06:49
-
2025-07-20 16:05:44
-
2025-07-20 16:05:36