2025年8月10日,OpenAI发布的开源模型gpt-oss采用MXFP4数据类型,将推理成本降低75%,推理速度提升4倍。新数据类型使1200亿参数的大模型可在80GB显存的显卡上运行,16GB显存即可支持200亿参数版本。MXFP4通过压缩权重存储和优化内存带宽,显著减少硬件资源需求,其缩放机制确保精度损失最小化。尽管MXFP4对硬件支持无严格要求,但性能优势需特定芯片(如Nvidia Blackwell)发挥最大效果。英伟达提出改进版NVFP4以进一步提升质量。OpenAI选择MXFP4表明其在大语言模型中的实用性。
原文链接
本文链接:https://kx.umi6.com/article/23368.html
转载请注明文章出处
相关推荐
换一换
中国AI云,开始「抢座次」了
2025-11-20 11:17:00
李彦宏:百度下一代旗舰大模型研发中 会在准备就绪后尽快发布
2025-08-20 21:19:28
字节跳动、阿里AI“大将”出走
2025-08-25 22:35:04
字节对大模型方向加码期权激励 核心技术员工最高可获百万元
2025-09-03 15:50:37
上海:推动医疗器械相关垂类大模型研发应用
2025-09-15 16:02:14
OpenAI的命门,决定了大模型公司的未来
2025-09-03 14:48:12
两部门:到2027年推动五个以上专业大模型在电网、发电、煤炭、油气等行业深度应用
2025-09-08 10:56:26
高性能计算群星闪耀时
2025-08-21 12:35:24
1300000000000000!谷歌每月Tokens消耗量曝光(别数了是千万亿)
2025-10-11 09:26:13
智谱与市城投集团合作发布杭州城投人工智能产业大模型项目(一期)建设成果
2025-09-15 20:01:43
中信建投:持续推荐AI算力板块
2025-10-28 08:39:40
豆包们,开始「上链接」
2025-10-27 10:54:08
美团发布并开源 LongCat-Flash-Chat 大模型:总参数 560B,AI 智能体任务表现突出
2025-09-01 11:16:10
633 文章
422742 浏览
24小时热文
更多
-
2026-01-23 09:43:53 -
2026-01-23 08:40:41 -
2026-01-23 06:34:26