1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
清华团队开源大模型推理引擎“赤兔 Chitu”,实现 DeepSeek 推理成本降低一半、性能翻番
3月14日,清华大学高性能计算研究所团队与清程极智联合宣布开源大模型推理引擎‘赤兔 Chitu’。该引擎首次实现在非Hopper架构GPU及国产芯片上原生运行FP8精度模型,使DeepSeek推理成本减半、性能翻倍。它支持NVIDIA多代产品及国产芯片优化,适用于CPU、单GPU到大规模集群部署,具备高稳定性,可满足生产环境需求。测试显示,部署DeepSeek-R1-671B满血版时,A800集群中赤兔引擎比某些国外开源框架节省50% GPU资源,推理速度提升3.15倍。该项目已在GitHub开源。
智慧轨迹
03-14 20:27:06
DeepSeek
大模型推理引擎
赤兔Chitu
分享至
打开微信扫一扫
内容投诉
生成图片
清华系创企清程极智开源大模型推理引擎“赤兔Chitu”
《科创板日报》14日消息,清华大学高性能计算研究所翟季冬教授团队与清程极智联合开源大模型推理引擎‘赤兔Chitu’。该引擎支持非英伟达Hopper架构GPU及国产芯片原生运行FP8精度模型。此次开源版本专注于解决市场急需的问题,即高效无损地将DeepSeek-R1 FP8精度模型部署至存量英伟达GPU。同时,针对多款国产芯片优化的版本也在计划开源中。此成果为AI模型推理提供了新的解决方案,具有重要技术突破和应用价值。
灵感Phoenix
03-14 15:17:14
大模型推理引擎
清华大学
赤兔Chitu
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序