微软推出首个FP4训练框架,实现与BF16相当的训练效果,所需存储和计算资源更少。该框架适用于高达130亿参数规模的模型,训练Token数量达千亿级别。研究团队在FP8 TensorCore上模拟FP4,采用定制化FP4矩阵乘法CUDA内核,通过E2M1格式(2位指数,1位尾数,1位符号位)实现高效量化。此框架对权重矩阵W和激活矩阵A采取不同粒度的量化策略,最大化利用FP4加速效果。为解决梯度问题,研究团队提出可微分梯度估计方法,并引入“离群点削峰和补偿”策略。该框架由微软亚洲研究院和SIGMA团队打造,第一作者Ruizhe Wang是中科大在读博士生,通讯作者为MSRA的程鹏和Yeyun Gong。
原文链接
本文链接:https://kx.umi6.com/article/12370.html
转载请注明文章出处
相关推荐
换一换
AI热潮带动业绩股价双升 微软CEO年薪跃升至近7亿
2025-10-22 17:51:04
自动截图玩家游戏画面训练AI 微软否认:只是为了识别
2025-10-26 18:22:58
微软将在英国投资300亿美元 用于人工智能基础设施建设与运营
2025-09-17 06:23:22
微软下一代AI芯片或由英特尔代工
2025-10-20 13:06:13
微软独家:OpenAI最新季度净亏损115亿美元
2025-11-01 10:21:05
微软与美国政府就免费软件服务达成新协议
2025-09-02 22:41:51
微软大手笔锁定 174 亿美元外部 AI GPU 云算力,Nebius 负责供应
2025-09-09 13:13:41
与 OpenAI“划清界限”,微软 AI 负责人苏莱曼称不会推出“成人模式”
2025-10-24 12:37:06
微软成立MAI超级智能团队:推进AI自主化摆脱对OpenAI依赖
2025-11-07 18:03:07
微软CEO称该公司计划于周五发布新的智能体AI模型
2025-12-11 13:53:32
AI PC到底有啥好处 微软:以前需要几万块 现在随便买
2025-10-12 21:47:10
AI泡沫担忧加剧之际 微软、英伟达与Anthropic宣布达成合作
2025-11-19 08:04:33
OpenAI拟将与微软分成比例降至8% 获500亿美元额外收入
2025-09-13 11:25:15
642 文章
448872 浏览
24小时热文
更多
-
2026-01-23 17:11:08 -
2026-01-23 17:10:00 -
2026-01-23 17:08:55