2025年8月10日,OpenAI发布的开源模型gpt-oss采用MXFP4数据类型,将推理成本降低75%,推理速度提升4倍。新数据类型使1200亿参数的大模型可在80GB显存的显卡上运行,16GB显存即可支持200亿参数版本。MXFP4通过压缩权重存储和优化内存带宽,显著减少硬件资源需求,其缩放机制确保精度损失最小化。尽管MXFP4对硬件支持无严格要求,但性能优势需特定芯片(如Nvidia Blackwell)发挥最大效果。英伟达提出改进版NVFP4以进一步提升质量。OpenAI选择MXFP4表明其在大语言模型中的实用性。
原文链接
本文链接:https://kx.umi6.com/article/23368.html
转载请注明文章出处
相关推荐
换一换
大模型驱动算力革命 AI芯片迎破局新机遇
2025-09-18 07:47:51
中国AI云,开始「抢座次」了
2025-11-20 11:17:00
王兴一鸣惊人!美团首个开源大模型追平DeepSeek-V3.1
2025-09-01 13:16:16
美团发布并开源 LongCat-Flash-Chat 大模型:总参数 560B,AI 智能体任务表现突出
2025-09-01 11:16:10
如何避免成为AI墓地的一员?
2025-07-23 13:50:51
字节对大模型方向加码期权激励 核心技术员工最高可获百万元
2025-09-03 15:50:37
GPT-5之后,奥特曼向左,梁文锋向右
2025-08-15 17:17:56
美团 LongCat 大模型官方 App 发布:支持联网搜索,还可以发起语音通话
2025-11-03 14:22:48
港股AGI第一股“云知声”首战告捷:大模型贡献1亿收入,单客价直线提升116.2%,AI保险业务暴涨1386.8%
2025-08-29 20:43:34
DeepSeek删豆包冲上热搜,大模型世子之争演都不演了
2025-08-21 13:31:42
中国信通院开展面向大模型的全栈国产软硬件系统适配测试工作
2025-07-23 16:55:22
把12个AI凑到一起打工,它们竟然搞起“小团体”?
2025-10-16 22:02:39
Gartner首次发布大模型报告:火山引擎排名中国厂商第一
2025-11-20 12:17:36
593 文章
353847 浏览
24小时热文
更多
-
2025-12-08 23:53:52 -
2025-12-08 22:52:38 -
2025-12-08 22:51:57