1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

2025年8月10日,OpenAI发布的开源模型gpt-oss采用MXFP4数据类型,将推理成本降低75%,推理速度提升4倍。新数据类型使1200亿参数的大模型可在80GB显存的显卡上运行,16GB显存即可支持200亿参数版本。MXFP4通过压缩权重存储和优化内存带宽,显著减少硬件资源需求,其缩放机制确保精度损失最小化。尽管MXFP4对硬件支持无严格要求,但性能优势需特定芯片(如Nvidia Blackwell)发挥最大效果。英伟达提出改进版NVFP4以进一步提升质量。OpenAI选择MXFP4表明其在大语言模型中的实用性。

原文链接
本文链接:https://kx.umi6.com/article/23368.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
大厂「AI」智能体,等待 DeepSeek 时刻
2025-07-31 11:05:08
上海累计82款大模型通过备案
2025-07-10 11:28:53
在上海WAIC,800展商无一不想成为黄仁勋
2025-07-27 07:50:27
大模型即OS,AI云即计算机:阿里的全栈赌注
2025-09-25 10:00:29
人类正在被AI「幻觉」欺骗
2025-08-20 10:10:57
OpenAI的命门,决定了大模型公司的未来
2025-09-03 14:48:12
31亿!我国大模型应用个人用户注册“爆表” 竟超全国人口规模2倍多
2025-07-31 12:06:11
大模型驱动算力革命 AI芯片迎破局新机遇
2025-09-18 07:47:51
用DeepSeek改造ERP,到底难在哪?怎么破?
2025-10-11 09:33:30
你用的大模型是什么MBTI?
2025-09-23 20:23:14
腾讯发布全新大模型混元3D 3.0
2025-09-16 10:11:57
百度生成式AI和大模型专利中国第一,全栈创新驱动AI应用领先
2025-07-18 16:41:37
消费电子将被大模型重新定义?云天励飞董事长陈宁:看好推理算力需求的爆发 全面押注AI芯片
2025-07-25 11:23:59
24小时热文
更多
扫一扫体验小程序