3月14日,清华大学高性能计算研究所团队与清程极智联合宣布开源大模型推理引擎‘赤兔 Chitu’。该引擎首次实现在非Hopper架构GPU及国产芯片上原生运行FP8精度模型,使DeepSeek推理成本减半、性能翻倍。它支持NVIDIA多代产品及国产芯片优化,适用于CPU、单GPU到大规模集群部署,具备高稳定性,可满足生产环境需求。测试显示,部署DeepSeek-R1-671B满血版时,A800集群中赤兔引擎比某些国外开源框架节省50% GPU资源,推理速度提升3.15倍。该项目已在GitHub开源。
原文链接
本文链接:https://kx.umi6.com/article/15481.html
转载请注明文章出处
相关推荐
换一换
梁文锋,Nature全球年度十大科学人物!
2025-12-09 10:25:17
DeepSeek 声明:防范冒用“深度求索”名义实施诈骗
2025-09-18 12:52:40
AI实盘操作,DeepSeek暴赚,Gemini崩盘,网友:专业对口就是不一样
2025-10-20 21:13:47
DeepSeek昨天悄悄扔的炸弹,今天爆了
2025-08-22 17:51:00
DeepSeek催化下,芯片带领沪指突破3800点
2025-08-22 20:52:41
好险,差点被DeepSeek幻觉害死
2025-07-09 15:08:10
「DeepSeek们」回答位变广告位
2025-08-05 15:15:26
DeepSeek线上模型升级:当前版本号 DeepSeek-V3.1-Terminus
2025-09-22 21:05:30
DeepSeek V3.1突现离谱Bug:“极”字满屏乱蹦,开发者一脸懵逼
2025-08-26 14:46:26
DeepSeek官方点赞元宝,罕见现身互动
2025-12-24 17:46:41
DeepSeek等开源模型,更“浪费”token吗?
2025-10-11 10:17:13
DeepSeek下一代技术提前曝光,梁文锋署名论文获ACL2025最佳论文奖
2025-07-31 09:00:51
DeepSeek突然拥抱国产GPU语言!对标CUDA替代Triton,华为Day0适配
2025-09-30 10:23:35
637 文章
446223 浏览
24小时热文
更多
-
2026-01-23 08:40:41 -
2026-01-23 06:34:26 -
2026-01-23 00:20:44