2025年8月10日,OpenAI发布的开源模型gpt-oss采用MXFP4数据类型,将推理成本降低75%,推理速度提升4倍。新数据类型使1200亿参数的大模型可在80GB显存的显卡上运行,16GB显存即可支持200亿参数版本。MXFP4通过压缩权重存储和优化内存带宽,显著减少硬件资源需求,其缩放机制确保精度损失最小化。尽管MXFP4对硬件支持无严格要求,但性能优势需特定芯片(如Nvidia Blackwell)发挥最大效果。英伟达提出改进版NVFP4以进一步提升质量。OpenAI选择MXFP4表明其在大语言模型中的实用性。
原文链接
本文链接:https://kx.umi6.com/article/23368.html
转载请注明文章出处
相关推荐
.png)
换一换
国产大模型高考裸分683:选清华 还是北大
2025-06-27 17:18:09
我国大模型数量居全球首位
2025-07-27 13:58:52
大模型低调出展,机器人各出奇招
2025-07-26 22:49:04
三家混战,大模型重回2023
2025-08-03 11:35:50
当大模型接入玩具 AI硬件与情绪消费殊途同归?
2025-06-15 08:50:11
中信建投武超则:大模型的迭代永无止境 坚定看好接下来AI应用的发展表现
2025-07-16 18:10:08
对话中国信通院魏凯:AI下半场,大模型要少说话,多做事
2025-07-01 08:51:07
31亿!我国大模型应用个人用户注册“爆表” 竟超全国人口规模2倍多
2025-07-31 12:06:11
企业管理软件是不是和AI无关?
2025-06-23 13:23:28
特想聊聊快手这次的变化
2025-06-25 08:43:51
大模型全员0分!谢赛宁领衔华人团队,最新编程竞赛基准出炉,题目每日更新禁止刷题
2025-06-19 10:46:15
2025大模型半年回顾:模型速度变缓
2025-06-25 19:34:48
GPT-5能让普通人变成博士,但魔法依旧没有
2025-08-08 12:10:14
456 文章
81004 浏览
24小时热文
更多

-
2025-08-11 18:06:13
-
2025-08-11 17:07:39
-
2025-08-11 17:06:35