微软推出首个FP4训练框架,实现与BF16相当的训练效果,所需存储和计算资源更少。该框架适用于高达130亿参数规模的模型,训练Token数量达千亿级别。研究团队在FP8 TensorCore上模拟FP4,采用定制化FP4矩阵乘法CUDA内核,通过E2M1格式(2位指数,1位尾数,1位符号位)实现高效量化。此框架对权重矩阵W和激活矩阵A采取不同粒度的量化策略,最大化利用FP4加速效果。为解决梯度问题,研究团队提出可微分梯度估计方法,并引入“离群点削峰和补偿”策略。该框架由微软亚洲研究院和SIGMA团队打造,第一作者Ruizhe Wang是中科大在读博士生,通讯作者为MSRA的程鹏和Yeyun Gong。
原文链接
本文链接:https://kx.umi6.com/article/12370.html
转载请注明文章出处
相关推荐
换一换
Nscale计划为微软在德克萨斯州建造大型AI数据中心
2025-10-15 18:44:36
微软、雪佛龙和Engine No.1签署电力供应独家协议
2026-04-01 08:35:31
微软宣布其首个自研图像生成模型 MAI-Image-1 已整合入 Bing 与 Copilot,逐步减少对 OpenAI 的依赖
2025-11-05 09:58:04
现有路径不通?OpenAI、亚马逊考虑改变大模型训练方式
2026-01-27 12:08:17
微软官宣Windows 11全新AI升级
2025-10-17 09:12:15
云业务助微软Q3业绩超预期 但创纪录资本支出成市场阴影
2025-10-30 08:32:56
自动截图玩家游戏画面训练AI 微软否认:只是为了识别
2025-10-26 18:22:58
特朗普称微软将做出调整,确保美国人的电费不会因 AI 需求而上涨
2026-01-13 16:45:26
微软又“懂”了:称Windows用户渴望AI 反遭网友怒怼!
2025-11-28 16:37:28
消息称微软 2025 财年财报掩盖投资 OpenAI 亏损,周三有可能公开情况
2025-10-27 22:17:35
微软否认削减AI产品销售目标
2025-12-04 20:46:13
微软承认Win11部分AI功能失败:将简化或删除 但不会放弃
2026-02-01 23:04:51
微软两日蒸发3810亿美元市值 揭示人工智能投资浪潮开始分化
2026-02-02 16:50:28
695 文章
566117 浏览
24小时热文
更多
-
2026-04-24 19:29:38 -
2026-04-24 18:31:29 -
2026-04-24 18:30:24