2025-11-20 22:47:09
趋境开源框架 KTransformers 成主流大模型首选,Qwen、Kimi、智谱 AI 推荐,单卡跑万亿模型
阅读:1210
标题:KTransformers 成主流大模型推理引擎,单卡跑万亿模型
正文:
趋境科技与清华联合开源的高性能异构推理框架 KTransformers,已成为 Qwen、Kimi、智谱 AI 等主流大模型的推荐推理引擎,并被多家硬件厂商采纳。其技术实力获国际认可,论文入选“计算机系统领域奥斯卡”SOSP 2025。
KTransformers 专注于高效利用 GPU、CPU 和内存等多样化算力,让大模型在低算力设备上也能流畅运行。例如,在月之暗面发布的 Kimi-K2-Thinking 模型中,KTransformers 支持单卡推理和 2 卡 LoRA 微调,大幅降低部署门槛。同时,该框架已完成对国产昇腾 NPU 的适配,提供全国产化推理解决方案。
在推理层面,KTransformers 与主流框架 SGLang 合作,用户只需简单安装相关组件即可通过单张消费级 GPU+CPU 运行模型。在微调层面,KTransformers 集成 LLaMA-Factory,支持轻量级微调方法,仅需消费级 GPU(如 RTX 4090)即可完成千亿参数模型的微调任务,显存占用降低 82%,吞吐量提升 1.8 倍。
趋境科技以“普惠顶尖 AI 智能与隐私”为理念,与多个国产硬件平台合作,推动高性价比算力方案落地,助力高校、实验室及中小企业参与大模型开发。KTransformers 让大模型推理摆脱高端算力依赖,未来将推动 AI 能力更广泛融入实际业务场景。
雷峰网版权文章,未经授权禁止转载。
原文链接
本文链接:https://kx.umi6.com/article/28853.html
转载请注明文章出处
相关推荐
换一换
KTransformers入选计算机系统顶会、与主流框架合作,趋境&清华让「异构」成为推理新范式
2025-10-23 10:01:08
2张4090竟能本地微调万亿参数Kimi K2!趋境联合清华北航把算力门槛击穿了
2025-11-05 16:12:15
纯靠“脑补”图像,大模型推理准确率狂飙80%丨剑桥谷歌新研究
2025-05-21 17:08:17
4090单卡跑满血版DeepSeek-R1,清华团队开源项目再破大模型推理门槛
2025-02-12 13:26:11
计算所严明玉团队新作: Attention 并非永远是瓶颈,多 GPU 并不一定更快
2025-12-22 11:41:00
斯坦福大模型推理课免费了,谷歌推理团队创始人主讲
2025-07-25 17:26:56
让用户无痛开发AI应用,袁进辉新公司获近亿元天使+轮融资 | 36氪首发
2024-07-04 12:29:16
xLLM社区重磅首秀,揭秘大模型推理全景图与开源AI Infra生态
2025-11-24 21:15:56
清华大学开源项目突破大模型算力瓶颈:RTX 4090 单卡实现 DeepSeek-R1 满血运行
2025-02-15 19:10:39
阿里云异构计算负责人王超:中国在高效普惠的算力供给方面具备显著优势
2025-01-07 19:17:49
中国移动发布“芯合”异构混合并行训练系统 1.0,支持多品牌万卡集群
2024-12-03 12:14:59
我读了读苹果的AI大模型论文,发现这几个秘密
2024-06-26 22:45:35
Apple的AI奠基性论文解读
2024-06-26 18:43:28
736 文章
530948 浏览
24小时热文
更多
-
2026-03-09 21:13:27 -
2026-03-09 20:09:26 -
2026-03-09 20:09:18