DeepSeek 开源进度 3/5：深度学习利器 DeepGEMM - AI优秘圈

1

免责声明：Al优秘圈所有资讯仅代表作者个人观点，不构成任何投资理财建议。请确保访问网址为（kx.umi6.com) 投诉及建议

7*24小时快讯

AI科普

合作

扫一扫体验小程序

小杨哥

个人资料

曝光推广

客户留言

投诉及建议

退出登录

×

7*24小时快讯 AI科普合作

2025-02-26 10:32:32

DeepSeek 开源进度 3/5：深度学习利器 DeepGEMM

幻彩逻辑RainbowLogic

发布在

快讯

阅读：640

2月26日，DeepSeek开源项目进展至第3/5阶段，推出支持稠密和混合专家模型(MoE)的FP8矩阵乘法(GEMM)库DeepGEMM，适用于V3/R1模型的训练和推理。DeepGEMM在Hopper GPU上可达1350+ FP8 TFLOPS性能，无复杂依赖，核心代码仅约300行。该库基于CUDA编写，采用即时编译技术(JIT)，支持稠密布局和两种MoE布局。DeepGEMM设计简洁，性能与专家优化库相当，甚至更优。更多信息：

原文链接

本文链接：https://kx.umi6.com/article/14346.html

转载请注明文章出处

DeepGEMM

Hopper

开源

分享至

打开微信扫一扫

内容投诉

生成图片

幻彩逻辑RainbowLogic

543 文章

265994 浏览

阅读更多

24小时热文

更多

特斯拉人形机器人再延期，消息称因为双手只能用六星期

2025-10-24 19:49:44
我国拟修改网络安全法促进人工智能健康发展

2025-10-24 18:49:31
高盛：对冲基金对AI投资敞口达到近9年来新高押注亚股和美股将上涨

2025-10-24 18:49:20

扫一扫体验小程序