1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

清华大学KVCache.AI团队与趋境科技联合发布的KTransformers开源项目取得重大进展,成功在RTX 4090单卡上实现DeepSeek-R1满血运行,解决了大模型本地部署难题。该项目于2月10日成功运行DeepSeek-R1、V3的671B满血版,速度提高3~28倍。KTransformers不仅支持DeepSeek模型,还兼容各类MoE模型,预处理速度最高达286 tokens/s,推理生成速度达14 tokens/s。此技术有望降低AI大模型的运行成本,使其更加普及。

原文链接
本文链接:https://kx.umi6.com/article/13467.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
中文在线:已在部分内部 AI 网文创作流程中部署 DeepSeek-R1
2025-02-05 22:14:26
超越 DeepSeek-R1,英伟达开源模型 Llama-Nemotron 登顶
2025-05-06 17:56:45
易点天下宣布AI技术中台已完成DeepSeek-R1私有化部署
2025-02-05 15:17:50
AI界“拼多多”DeepSeek国内外刷屏!龙头20CM一字板,受益上市公司梳理
2025-02-01 16:25:38
融合DeepSeek-R1推理能力,有道发布“AI答疑笔”
2025-02-18 14:15:12
DeepSeek-R1 大模型登陆腾讯云,宣称“一键部署、3 分钟调用”
2025-02-02 11:44:23
网易有道全线AI应用接入DeepSeek-R1
2025-02-06 17:34:52
英伟达:DeepSeek-R1 模型现已上线 NIM 微服务平台
2025-01-31 09:47:50
海外用户也有份,传音 Infinix AI 接入 DeepSeek-R1 满血版
2025-02-24 00:07:55
DeepSeek,引爆AI手机?
2025-02-07 12:53:26
4090单卡跑满血版DeepSeek-R1,清华团队开源项目再破大模型推理门槛
2025-02-12 13:26:11
国产AI搜索接入DeepSeek-R1,深度试玩报告抢先出炉:正愁用不上官方联网搜索
2025-02-05 17:07:26
智联招聘官宣接入DeepSeek:推出AI招聘助手“Ailin”
2025-02-06 16:34:25
24小时热文
更多
扫一扫体验小程序