1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:KTransformers 成主流大模型推理引擎,单卡跑万亿模型

正文:
趋境科技与清华联合开源的高性能异构推理框架 KTransformers,已成为 Qwen、Kimi、智谱 AI 等主流大模型的推荐推理引擎,并被多家硬件厂商采纳。其技术实力获国际认可,论文入选“计算机系统领域奥斯卡”SOSP 2025。

KTransformers 专注于高效利用 GPU、CPU 和内存等多样化算力,让大模型在低算力设备上也能流畅运行。例如,在月之暗面发布的 Kimi-K2-Thinking 模型中,KTransformers 支持单卡推理和 2 卡 LoRA 微调,大幅降低部署门槛。同时,该框架已完成对国产昇腾 NPU 的适配,提供全国产化推理解决方案。

在推理层面,KTransformers 与主流框架 SGLang 合作,用户只需简单安装相关组件即可通过单张消费级 GPU+CPU 运行模型。在微调层面,KTransformers 集成 LLaMA-Factory,支持轻量级微调方法,仅需消费级 GPU(如 RTX 4090)即可完成千亿参数模型的微调任务,显存占用降低 82%,吞吐量提升 1.8 倍。

趋境科技以“普惠顶尖 AI 智能与隐私”为理念,与多个国产硬件平台合作,推动高性价比算力方案落地,助力高校、实验室及中小企业参与大模型开发。KTransformers 让大模型推理摆脱高端算力依赖,未来将推动 AI 能力更广泛融入实际业务场景。

雷峰网版权文章,未经授权禁止转载。

原文链接
本文链接:https://kx.umi6.com/article/28853.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
Apple的AI奠基性论文解读
2024-06-26 18:43:28
4090单卡跑满血版DeepSeek-R1,清华团队开源项目再破大模型推理门槛
2025-02-12 13:26:11
趋境开源框架 KTransformers 成主流大模型首选,Qwen、Kimi、智谱 AI 推荐,单卡跑万亿模型
2025-11-20 22:47:09
让用户无痛开发AI应用,袁进辉新公司获近亿元天使+轮融资 | 36氪首发
2024-07-04 12:29:16
斯坦福大模型推理课免费了,谷歌推理团队创始人主讲
2025-07-25 17:26:56
异构计算+高性能低功耗NPU,高通正在推动终端侧生成式AI发展
2024-09-06 19:49:01
阿里云异构计算负责人王超:中国在高效普惠的算力供给方面具备显著优势
2025-01-07 19:17:49
我读了读苹果的AI大模型论文,发现这几个秘密
2024-06-26 22:45:35
清华大学开源项目突破大模型算力瓶颈:RTX 4090 单卡实现 DeepSeek-R1 满血运行
2025-02-15 19:10:39
KTransformers入选计算机系统顶会、与主流框架合作,趋境&清华让「异构」成为推理新范式
2025-10-23 10:01:08
中国移动发布“芯合”异构混合并行训练系统 1.0,支持多品牌万卡集群
2024-12-03 12:14:59
Deepseek大模型推理算法其实很简单
2025-02-09 16:51:53
纯靠“脑补”图像,大模型推理准确率狂飙80%丨剑桥谷歌新研究
2025-05-21 17:08:17
24小时热文
更多
扫一扫体验小程序