2025年8月10日,OpenAI发布的开源模型gpt-oss采用MXFP4数据类型,将推理成本降低75%,推理速度提升4倍。新数据类型使1200亿参数的大模型可在80GB显存的显卡上运行,16GB显存即可支持200亿参数版本。MXFP4通过压缩权重存储和优化内存带宽,显著减少硬件资源需求,其缩放机制确保精度损失最小化。尽管MXFP4对硬件支持无严格要求,但性能优势需特定芯片(如Nvidia Blackwell)发挥最大效果。英伟达提出改进版NVFP4以进一步提升质量。OpenAI选择MXFP4表明其在大语言模型中的实用性。
原文链接
本文链接:https://kx.umi6.com/article/23368.html
转载请注明文章出处
相关推荐
换一换
清华孙茂松:对工业界而言,大厂可以Scaling,其他玩家重在垂直应用 | MEET2026
2025-12-21 10:35:20
雷军宣布:小米AI人才招聘专项正式启动!
2026-03-30 16:59:23
把12个AI凑到一起打工,它们竟然搞起“小团体”?
2025-10-16 22:02:39
美国AI春晚,一盆凉水浇在Agent身上
2025-12-10 16:57:11
舔狗AI和被预约的寿司郎
2026-06-05 00:34:31
全球首份大模型业绩报!MiniMax预判2026三大超级PMF,AI平台公司启程了
2026-03-03 11:54:49
杭州“十五五”规划建议:实施大模型前沿技术攻关和高端芯片、基础软件、模型算法等研发计划 建设人工智能开源社区
2026-01-16 11:34:57
百度推动大模型与搜推业务融合
2026-03-18 15:35:09
智谱上市后首份财报:超7.24亿元!国内收入最高大模型公司,MaaS发力了
2026-03-31 21:04:07
宇树科技王兴兴:谁能把机器人用的大模型做出来 谁就是全世界最厉害的AI公司和机器人公司
2026-01-30 12:25:48
百度世界2025将于11月13日在北京举办
2025-10-13 20:03:11
大模型的尽头 怎么是费大厨辣椒炒肉?
2026-05-24 15:42:37
李开复任命三位新高管:零一万物的“一把手工程”与大模型中场战事
2025-10-27 13:00:52
715 文章
639436 浏览
24小时热文
更多
-
2026-06-09 00:54:40 -
2026-06-09 00:53:08 -
2026-06-08 23:49:41