微软推出首个FP4训练框架,实现与BF16相当的训练效果,所需存储和计算资源更少。该框架适用于高达130亿参数规模的模型,训练Token数量达千亿级别。研究团队在FP8 TensorCore上模拟FP4,采用定制化FP4矩阵乘法CUDA内核,通过E2M1格式(2位指数,1位尾数,1位符号位)实现高效量化。此框架对权重矩阵W和激活矩阵A采取不同粒度的量化策略,最大化利用FP4加速效果。为解决梯度问题,研究团队提出可微分梯度估计方法,并引入“离群点削峰和补偿”策略。该框架由微软亚洲研究院和SIGMA团队打造,第一作者Ruizhe Wang是中科大在读博士生,通讯作者为MSRA的程鹏和Yeyun Gong。
原文链接
本文链接:https://kx.umi6.com/article/12370.html
转载请注明文章出处
相关推荐
.png)
换一换
OpenAI走向“算力帝国”
2025-09-22 18:02:48
昔日盟友关系破裂?OpenAI高管据称讨论起诉微软垄断行为
2025-06-17 12:23:06
微软进军AI浏览器,维持巨头的平庸
2025-07-30 10:44:27
微软:将把OpenAI的GPT-5整合到消费者、开发者和企业产品中
2025-08-08 02:03:03
裁员 9000 人后微软高管表态:想留下,就得学会 AI
2025-07-10 23:29:32
微软据悉就长期获取OpenAI技术展开深入谈判 协议或数周内达成
2025-07-29 20:37:17
微软为了AI,买了17亿美金的屎
2025-07-28 12:11:42
三巨头聚首光通信:微软集结康宁、贺利氏 空芯光纤加速量产落地
2025-09-27 14:42:46
微软解锁 AI 配音新技能:生成最长 90 秒多角色叙述,语音更像真人
2025-08-30 15:51:23
微软宣布引入GPT-oss模型
2025-08-06 09:27:44
为 AI“降温”:微软亮出散热王牌 HXU,性能提升 100%、支持 240kW 机架功率
2025-10-15 10:37:06
“AI 人才争夺战”战火持续燃烧,微软挖走谷歌 DeepMind 部门 20 余名人才
2025-07-23 16:53:56
AI热潮带动业绩股价双升 微软CEO年薪跃升至近7亿
2025-10-22 17:51:04
554 文章
293648 浏览
24小时热文
更多

-
2025-10-24 01:20:07
-
2025-10-24 00:18:56
-
2025-10-23 21:15:29