2025年8月10日,OpenAI发布的开源模型gpt-oss采用MXFP4数据类型,将推理成本降低75%,推理速度提升4倍。新数据类型使1200亿参数的大模型可在80GB显存的显卡上运行,16GB显存即可支持200亿参数版本。MXFP4通过压缩权重存储和优化内存带宽,显著减少硬件资源需求,其缩放机制确保精度损失最小化。尽管MXFP4对硬件支持无严格要求,但性能优势需特定芯片(如Nvidia Blackwell)发挥最大效果。英伟达提出改进版NVFP4以进一步提升质量。OpenAI选择MXFP4表明其在大语言模型中的实用性。
原文链接
本文链接:https://kx.umi6.com/article/23368.html
转载请注明文章出处
相关推荐
换一换
开源模型TOP5,被中国厂商包圆了
2025-10-15 17:36:49
真正面向大模型的AI Infra,必须同时懂模型、系统、产业|商汤大装置宣善明@MEET2026
2025-12-22 10:35:49
火线解析智谱AI招股书:年营收3亿增速130%,率先冲刺全球大模型第一股
2025-12-19 23:14:23
啊?微博7800美元训的大模型,数学能力超了DeepSeek-R1
2025-11-18 14:20:39
亚马逊云科技发布多款大模型
2025-12-03 14:25:54
豆包们,开始「上链接」
2025-10-27 10:54:08
腾讯发布全新大模型混元3D 3.0
2025-09-16 10:11:57
美国AI春晚,一盆凉水浇在Agent身上
2025-12-10 16:57:11
MEET2026挤爆了,AI圈今年最该听的20+场演讲&对谈都在这
2025-12-11 15:57:49
腾讯升级大模型研发架构 前OpenAI顶尖研究员出任首席AI科学家
2025-12-17 18:59:08
中国企业调用大模型日均达37万亿tokens
2026-02-24 13:54:18
消息称小米研发智能问答助手产品“Mi Chat”
2025-12-09 17:51:08
Q2财报启示录:AI为大厂们带来了新「钱景」
2025-09-03 14:46:42
664 文章
472674 浏览
24小时热文
更多
-
2026-03-09 21:13:27 -
2026-03-09 20:09:26 -
2026-03-09 20:09:18