微软推出首个FP4训练框架,实现与BF16相当的训练效果,所需存储和计算资源更少。该框架适用于高达130亿参数规模的模型,训练Token数量达千亿级别。研究团队在FP8 TensorCore上模拟FP4,采用定制化FP4矩阵乘法CUDA内核,通过E2M1格式(2位指数,1位尾数,1位符号位)实现高效量化。此框架对权重矩阵W和激活矩阵A采取不同粒度的量化策略,最大化利用FP4加速效果。为解决梯度问题,研究团队提出可微分梯度估计方法,并引入“离群点削峰和补偿”策略。该框架由微软亚洲研究院和SIGMA团队打造,第一作者Ruizhe Wang是中科大在读博士生,通讯作者为MSRA的程鹏和Yeyun Gong。
原文链接
本文链接:https://kx.umi6.com/article/12370.html
转载请注明文章出处
相关推荐
换一换
270万人怒了!微软AI订阅被控诱骗用户:面临1.75亿美元天价退款
2025-11-07 18:04:13
微软正在大力投资训练自研AI大模型
2025-09-15 17:03:27
特朗普称微软将做出调整,确保美国人的电费不会因 AI 需求而上涨
2026-01-13 16:45:26
微软将在美国威斯康星州建第二座数据中心 累计投资超70亿美元
2025-09-19 08:08:15
微软独家:OpenAI最新季度净亏损115亿美元
2025-11-01 10:21:05
微软 CEO 纳德拉被曝亲自抓 AI 产品:每周开会、反复问进展、施压负责人
2025-12-23 00:08:48
Nscale计划为微软在德克萨斯州建造大型AI数据中心
2025-10-15 18:44:36
微软出奇招:让美国网红带货AI产品 Copilot瞄准年轻消费者
2025-11-10 23:37:34
微软 AI CEO 苏莱曼预言:五年内人人将拥有亲密的专属 AI 伴侣
2026-01-20 23:34:12
AI PC到底有啥好处 微软:以前需要几万块 现在随便买
2025-10-12 21:47:10
奥特曼纳德拉同台回应一切:合作细节、OpenAI未来路线曝光
2025-11-02 18:36:32
微软官宣Windows 11全新AI升级
2025-10-17 09:12:15
微软达成62亿美元挪威AI基础设施协议
2025-09-18 09:52:06
662 文章
488846 浏览
24小时热文
更多
-
2026-03-09 21:13:27 -
2026-03-09 20:09:26 -
2026-03-09 20:09:18