微软论文意外曝光GPT核心机密:4o-mini仅8B,o1约300B
微软在一篇论文中意外透露了OpenAI模型的参数细节。论文显示,GPT-4o-mini约有8B参数,o1-preview约300B参数。此外,微软还提到了其他模型的参数,包括GPT-4o约200B,Claude 3.5 Sonnet 2024-10-22版本约175B,以及微软自家的Phi-3-7B模型。
尽管论文中提到这些数据是估计值,但仍引发广泛讨论。一些人质疑为何没有提及谷歌Gemini模型的参数。有人猜测,这可能是因为大多数模型在英伟达GPU上运行,而谷歌模型则在TPU上运行,使得参数估计更为复杂。
微软并非首次“意外”泄露此类信息。今年10月,微软曾在另一篇论文中“意外”曝光GPT-3.5-Turbo的20B参数,后又被删除。
该论文主要介绍了MEDEC benchmark,旨在识别和纠正临床笔记中的错误。研究显示,Claude 3.5 Sonnet在错误标志检测方面表现优异,得分70.16,其次是o1-mini。
每次模型参数的曝光都引发热议。此次泄露再次引发了关于模型大小和技术优势的讨论。
原文链接
本文链接:https://kx.umi6.com/article/11086.html
转载请注明文章出处
相关推荐
换一换
4o-mini只有8B,o1也才300B!微软论文意外曝光GPT核心机密
2025-01-02 11:13:09
杭州领跑AI开源!阿里Qwen除夕开源视觉理解新旗舰,全系列3尺寸,7B模型超GPT-4o-mini
2025-01-28 10:42:11
杭州:到2030年培育国际顶尖水平的开源基础大模型3个以上
2026-01-21 13:13:30
摩尔线程携手硅基流动实现DeepSeek-V3大模型高性能推理
2026-01-21 20:31:18
2026年将成消费电子「最贵之年」?
2026-01-22 00:31:16
苏州“十五五”规划建议:推进人工智能驱动的新型科研范式、技术研发、工程实现、产品落地一体化协同发展 积极部署人工智能芯片、量子等创新应用技术
2026-01-21 20:27:59
没有商业模式,是DeepSeek最坚固的「护城河」
2026-01-21 14:10:41
上海智能制造行业沙龙暨VENTURE50路演日成功举办
2026-01-21 16:17:17
下载超 10 亿、衍生模型破 20 万,阿里千问刷新全球开源模型纪录
2026-01-21 16:18:32
农业农村部:将持续推动人工智能等在农业领域应用
2026-01-22 11:51:14
商务部等9部门:推动药品零售企业监管向服务型监管、预防型监管、数智化治理转变
2026-01-22 17:04:48
Node.js之父:手写代码已死
2026-01-22 14:57:11
Anthropic下调其利润率预期
2026-01-22 11:52:20
693 文章
477779 浏览
24小时热文
更多
-
2026-01-23 00:20:44 -
2026-01-22 23:18:34 -
2026-01-22 23:17:29