1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

2025年8月10日,OpenAI发布的开源模型gpt-oss采用MXFP4数据类型,将推理成本降低75%,推理速度提升4倍。新数据类型使1200亿参数的大模型可在80GB显存的显卡上运行,16GB显存即可支持200亿参数版本。MXFP4通过压缩权重存储和优化内存带宽,显著减少硬件资源需求,其缩放机制确保精度损失最小化。尽管MXFP4对硬件支持无严格要求,但性能优势需特定芯片(如Nvidia Blackwell)发挥最大效果。英伟达提出改进版NVFP4以进一步提升质量。OpenAI选择MXFP4表明其在大语言模型中的实用性。

原文链接
本文链接:https://kx.umi6.com/article/23368.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
张亚勤谈大模型的未来:全球不超10个 且中美将各占三四个
2026-03-18 11:06:09
Gartner首次发布大模型报告:火山引擎排名中国厂商第一
2025-11-20 12:17:36
推理成本打到1元/每百万token,浪潮信息撬动Agent规模化的“最后一公里”
2025-12-26 15:45:08
Ilya罕见发声:大模型「大力出奇迹」到头了
2025-11-26 09:32:32
用DeepSeek改造ERP,到底难在哪?怎么破?
2025-10-11 09:33:30
Flash Attention作者最新播客:英伟达GPU统治三年内将终结
2025-09-29 15:09:28
腾讯混元大模型品牌 Hunyuan 更名为 HY
2025-12-10 15:53:58
华人AI大神霸气离职,一篇博客挑明中美大模型暗战
2025-10-11 10:14:30
建议你不要再相信AI基准测试,排行榜已经没啥公信力了
2025-12-04 12:18:33
大模型驱动算力革命 AI芯片迎破局新机遇
2025-09-18 07:47:51
MEET2026挤爆了,AI圈今年最该听的20+场演讲&对谈都在这
2025-12-11 15:57:49
汪军对话 Rich Sutton:大模型在一定程度上分散了我们对智能理解的注意力
2025-09-28 11:53:51
开源模型TOP5,被中国厂商包圆了
2025-10-15 17:36:49
24小时热文
更多
扫一扫体验小程序