微软推出首个FP4训练框架,实现与BF16相当的训练效果,所需存储和计算资源更少。该框架适用于高达130亿参数规模的模型,训练Token数量达千亿级别。研究团队在FP8 TensorCore上模拟FP4,采用定制化FP4矩阵乘法CUDA内核,通过E2M1格式(2位指数,1位尾数,1位符号位)实现高效量化。此框架对权重矩阵W和激活矩阵A采取不同粒度的量化策略,最大化利用FP4加速效果。为解决梯度问题,研究团队提出可微分梯度估计方法,并引入“离群点削峰和补偿”策略。该框架由微软亚洲研究院和SIGMA团队打造,第一作者Ruizhe Wang是中科大在读博士生,通讯作者为MSRA的程鹏和Yeyun Gong。
原文链接
本文链接:https://kx.umi6.com/article/12370.html
转载请注明文章出处
相关推荐
换一换
微软 AI 部门 CEO 苏莱曼:不会参加“AGI 竞赛”,将开发以人为本的超级智能
2025-11-07 19:05:07
使用量一直难突破,微软出奇招邀请网红拍短视频为 Copilot“带货”
2025-11-11 12:05:31
与 OpenAI“划清界限”,微软 AI 负责人苏莱曼称不会推出“成人模式”
2025-10-24 12:37:06
为 AI“降温”:微软亮出散热王牌 HXU,性能提升 100%、支持 240kW 机架功率
2025-10-15 10:37:06
微软据悉加大力度抢夺AI人才 瞄准Meta多个团队
2025-08-13 16:38:52
微软与美国政府就免费软件服务达成新协议
2025-09-02 22:41:51
微软组建超级智能团队 聚焦医疗诊断等领域
2025-11-07 00:25:07
突发!微软与OpenAI同日开火:语音之战+通用大模型,AI霸权决战打响
2025-08-30 11:49:23
微软与Lambda达成数十亿美元的人工智能基础设施协议
2025-11-04 01:50:36
20 万块 GB300、140 亿美元,微软与 AI 云 Nscale 达成重大交易
2025-10-16 14:57:12
微软否认削减AI产品销售目标
2025-12-04 20:46:13
AI热潮带动业绩股价双升 微软CEO年薪跃升至近7亿
2025-10-22 17:51:04
微软打造首个 AI 超级工厂:多座新一代 Fairwater 数据中心构成站点网络
2025-11-13 14:03:47
601 文章
381317 浏览
24小时热文
更多
-
2025-12-08 12:28:38 -
2025-12-08 12:27:32 -
2025-12-08 12:26:26