1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:OpenAI的命门,决定了大模型公司的未来

如果Scaling Law是提升大模型能力的关键标尺,那么“算力成本控制”就是行业发展的基石。2025年初,DeepSeek因大幅降低推理和训练算力成本而在开源社区爆火,其成功秘诀在于MoE架构的应用,这种架构能有效减少算力消耗。然而,OpenAI在GPT-5中推出的“路由”功能却成为一场“降本增笑”的翻车事件。尽管回滚了部分问题并允许用户手动切换模型,但GPT-5仍因路由功能未能匹配用户预期与模型能力而饱受批评。

为什么OpenAI冒着风险强推路由功能?原因有二:一是随着模型数量增加,用户难以选择合适的模型;二是从算力成本角度出发,推理模型与非推理模型的算力差异可能达5~6倍,延迟甚至相差60倍以上。通过路由识别简单任务并分配到低消耗模型,可显著降低算力成本。对于服务数亿用户的OpenAI来说,路由功能直接关系到商业模式的可持续性。

然而,为大模型打造高效的路由功能难度极高。这一问题涉及多目标优化,包括质量、延迟、成本等。DeepSeek尝试通过混合推理模型提高效率,虽然速度更快、输出更精简,但也暴露出稳定性问题。这表明,无论是OpenAI还是DeepSeek,在优化“深度思考”调度上都面临巨大挑战。

与此同时,OpenAI对算力的需求持续增长,正推进代号为Stargate的基础设施扩张计划,并计划在印度建设数据中心。“AI成本悖论”推动了算力需求的上升,也对路由功能提出了更高要求。Sam Altman的目标是2025年底上线超过100万片GPU,长远愿景则是“一亿GPU量级”。在推理单价下降、任务复杂度上升的背景下,高效调度“深度思考”能力,将成为大模型公司在系统效率、商业效率和用户体验上领先的关键。

(本文来自微信公众号:直面AI,作者:胡润,编辑:王靖)

原文链接
本文链接:https://kx.umi6.com/article/24641.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
火线解析智谱AI招股书:年营收3亿增速130%,率先冲刺全球大模型第一股
2025-12-19 23:14:23
开源模型TOP5,被中国厂商包圆了
2025-10-15 17:36:49
MiniMax M3一手实测:老黄PPT上74个Logo,我以为能难住它
2026-06-03 00:53:27
国产AI又一轮爆发 MiniMax M3大模型要来了:10-15倍性能改善
2026-05-27 12:26:00
月之暗面近20天收入超去年全年
2026-02-23 19:11:04
宇树科技王兴兴:谁能把机器人用的大模型做出来 谁就是全世界最厉害的AI公司和机器人公司
2026-01-30 12:25:48
大模型收入暴涨1076%,港股AGI第一股首份年报:一年狂揽12亿,属实把商业化玩明白了
2026-03-27 17:08:13
北京备案大模型达225款 占全国总量约三成
2026-04-22 20:27:12
Manus救不了Meta
2026-01-08 20:35:12
智谱首份业绩报告:商业化全面爆发,Maas平台ARR达17亿元提升60倍
2026-03-31 18:02:15
张亚勤谈大模型的未来:全球不超10个 且中美将各占三四个
2026-03-18 11:06:09
智谱AI,排名「第二」
2025-12-21 12:41:26
中国中文信息学会2025学术年会暨第二届中国大模型大会(CIPS & CLM 2025)于10月28日在北京盛大开幕
2025-10-30 18:52:50
24小时热文
更多
扫一扫体验小程序