清华大学KVCache.AI团队与趋境科技联合发布的KTransformers开源项目取得重大进展,成功在RTX 4090单卡上实现DeepSeek-R1满血运行,解决了大模型本地部署难题。该项目于2月10日成功运行DeepSeek-R1、V3的671B满血版,速度提高3~28倍。KTransformers不仅支持DeepSeek模型,还兼容各类MoE模型,预处理速度最高达286 tokens/s,推理生成速度达14 tokens/s。此技术有望降低AI大模型的运行成本,使其更加普及。
原文链接
本文链接:https://kx.umi6.com/article/13467.html
转载请注明文章出处
相关推荐
.png)
换一换
成本仅国外三十分之一,中国大模型已经追上美国了?
2025-01-26 08:08:30
华为昇腾推理DeepSeek-R1,性能比肩高端GPU,API免费无限量
2025-02-04 19:40:44
DeepSeek-R1 深度推理、1699 元,有道 SpaceOne 全面屏答疑词典笔发布
2025-02-18 15:24:31
DeepSeek 开源最强推理模型 R1,再震欧美同行
2025-01-21 17:40:46
OPPO ColorOS 小布助手完成 DeepSeek R1 最新版升级
2025-06-09 15:31:10
腾讯云:支持DeepSeek-R1大模型一键部署
2025-02-02 12:46:39
腾讯文档接入 DeepSeek-R1 满血版,支持实时联网搜索
2025-02-17 15:55:37
腾讯元宝接入Deepseek-R1满血版 支持联网搜索并整合公众号信息源
2025-02-13 17:23:01
全国首个,深圳海关智能查验机器人引入“满血版”DeepSeek-R1
2025-04-07 09:46:17
Andrej Karpathy 最新视频盛赞 DeepSeek:R1 正在发现人类思考的逻辑并进行复现
2025-02-07 15:00:52
支持 API 调用,国家超算互联网平台上线 DeepSeek-R1 满血版
2025-02-09 22:53:25
华为昇腾适配支持 DeepSeek-R1 复现项目 Open R1
2025-02-11 18:59:29
梁文锋不着急
2025-05-30 21:56:33
531 文章
173276 浏览
24小时热文
更多

-
2025-09-07 00:40:01
-
2025-09-06 23:39:46
-
2025-09-06 22:39:24