1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

清华大学KVCache.AI团队与趋境科技联合发布的KTransformers开源项目取得重大进展,成功在RTX 4090单卡上实现DeepSeek-R1满血运行,解决了大模型本地部署难题。该项目于2月10日成功运行DeepSeek-R1、V3的671B满血版,速度提高3~28倍。KTransformers不仅支持DeepSeek模型,还兼容各类MoE模型,预处理速度最高达286 tokens/s,推理生成速度达14 tokens/s。此技术有望降低AI大模型的运行成本,使其更加普及。

原文链接
本文链接:https://kx.umi6.com/article/13467.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
满血DeepSeek-R1+Cursor打通!无问芯穹上线API服务,能力拉满,7大国产算力保驾护航
2025-02-11 15:53:01
自家芯片助力:SambaNova 推出“最快”DeepSeek-R1 671B 模型推理云服务
2025-02-21 17:53:53
4090单卡跑满血版DeepSeek-R1,清华团队开源项目再破大模型推理门槛
2025-02-12 13:26:11
联通云上架 DeepSeek-R1 系列模型
2025-02-05 16:06:57
网易有道宣布拥抱 DeepSeek 大模型,智能硬件新品不久后推出
2025-02-06 19:39:35
国产AI搜索接入DeepSeek-R1,深度试玩报告抢先出炉:正愁用不上官方联网搜索
2025-02-05 17:07:26
华为昇腾推理DeepSeek-R1,性能比肩高端GPU,API免费无限量
2025-02-04 19:40:44
黄仁勋:DeepSeek R1点燃了全球热情
2025-02-27 21:42:17
网易有道全线AI应用接入DeepSeek-R1
2025-02-06 17:34:52
攻略在手,轻松玩转 DeepSeek
2025-02-08 21:33:12
DeepSeek-R1超级外挂!“人类最后的考试”首次突破30分,上海交大等开源方案碾压OpenAI、谷歌
2025-07-09 14:04:55
腾讯文档接入 DeepSeek-R1 满血版,支持实时联网搜索
2025-02-17 15:55:37
英伟达:DeepSeek-R1 模型现已上线 NIM 微服务平台
2025-01-31 09:47:50
24小时热文
更多
扫一扫体验小程序