微软推出首个FP4训练框架,实现与BF16相当的训练效果,所需存储和计算资源更少。该框架适用于高达130亿参数规模的模型,训练Token数量达千亿级别。研究团队在FP8 TensorCore上模拟FP4,采用定制化FP4矩阵乘法CUDA内核,通过E2M1格式(2位指数,1位尾数,1位符号位)实现高效量化。此框架对权重矩阵W和激活矩阵A采取不同粒度的量化策略,最大化利用FP4加速效果。为解决梯度问题,研究团队提出可微分梯度估计方法,并引入“离群点削峰和补偿”策略。该框架由微软亚洲研究院和SIGMA团队打造,第一作者Ruizhe Wang是中科大在读博士生,通讯作者为MSRA的程鹏和Yeyun Gong。
原文链接
本文链接:https://kx.umi6.com/article/12370.html
转载请注明文章出处
相关推荐
换一换
微软否认削减AI产品销售目标
2025-12-04 20:46:13
美国开源AI最后的旗帜,也倒了
2026-03-30 16:59:02
微软成立MAI超级智能团队:推进AI自主化摆脱对OpenAI依赖
2025-11-07 18:03:07
微软 CEO 纳德拉被曝亲自抓 AI 产品:每周开会、反复问进展、施压负责人
2025-12-23 00:08:48
微软公司:将不再向OpenAI支付收入分成 微软的OpenAI许可现将转为非独家许可
2026-04-27 21:37:38
微软高管誓言:若AI开始威胁人类 将立刻停止相关研发工作
2025-12-12 18:02:05
用AI代码替换Windows里每一行C/C++!微软回应了
2025-12-25 22:00:44
双非大学生,涌入大厂AI流水线
2025-12-04 18:35:49
微软CEO爆料:盖茨最初认为对OpenAI的投资就像是烧钱
2025-10-29 18:04:05
消息称微软 2025 财年财报掩盖投资 OpenAI 亏损,周三有可能公开情况
2025-10-27 22:17:35
微软打造首个 AI 超级工厂:多座新一代 Fairwater 数据中心构成站点网络
2025-11-13 14:03:47
微软打包收购OpenAI?就差一点!
2026-01-21 17:19:03
微软前副总裁炮轰:微软已错失AI浪潮 正重蹈互联网与移动时代的覆辙
2026-05-18 12:34:23
726 文章
668236 浏览
24小时热文
更多
-
2026-06-09 00:54:40 -
2026-06-09 00:53:08 -
2026-06-08 23:49:41