2月26日,DeepSeek开源项目进展至第3/5阶段,推出支持稠密和混合专家模型(MoE)的FP8矩阵乘法(GEMM)库DeepGEMM,适用于V3/R1模型的训练和推理。DeepGEMM在Hopper GPU上可达1350+ FP8 TFLOPS性能,无复杂依赖,核心代码仅约300行。该库基于CUDA编写,采用即时编译技术(JIT),支持稠密布局和两种MoE布局。DeepGEMM设计简洁,性能与专家优化库相当,甚至更优。更多信息:
原文链接
本文链接:https://kx.umi6.com/article/14346.html
转载请注明文章出处
相关推荐
换一换
蚂蚁灵波开源具身大模型LingBot-VLA,让机器人“看的更清楚 做的更明白”
2026-01-28 11:08:15
大厂AI各走「开源」路
2025-10-17 09:09:57
智谱上线并开源文本转语音模型 GLM-TTS:只需 3 秒语音样本即可克隆声音
2025-12-11 10:42:18
腾讯智能体框架 Youtu-Agent 开源,搭建 Agent 只需两步
2025-09-02 16:34:48
蚂蚁发布并开源万亿参数思考模型Ring-1T
2025-10-14 17:25:02
华为UCM推理记忆管理技术正式开源
2025-11-05 16:17:45
商汤开源空间智能大模型SenseNova-SI
2025-11-11 08:59:30
钉钉CLI开源 原生支持ClaudeCode、Cursor、Qoder等
2026-03-27 21:22:12
力压Seedance 2.0! 神秘AI模型登全球AI评测榜第一名:正式宣布开源
2026-04-09 12:05:02
AI 推理性能大提升:华为 UCM 技术开源,系统吞吐猛增 22 倍
2025-11-05 18:16:46
连续发布两款万亿参数模型,蚂蚁 AI 来势汹汹
2025-10-11 16:31:47
小米语音首席科学家:AI发展的本质就像生物进化,不开源要慢1000倍 | MEET2026
2025-12-16 09:28:45
兑现承诺!马斯克旗下xAI宣布Grok 2.5正式开源
2025-08-25 16:33:11
742 文章
666628 浏览
24小时热文
更多
-
2026-06-09 00:54:40 -
2026-06-09 00:53:08 -
2026-06-08 23:49:41