近期AI行业动态密集,涉及Scaling Law的困境、强化学习的崭露头角、OpenAI的草莓模型发布预告,以及ChatGPT Pro订阅计划的上线。首先,AI行业的普遍感受是大语言模型的进步停滞,尤其是达到数千亿参数后,成本和难度显著增加,尽管上万亿参数并未带来质变提升。硅谷共识聚焦于强化学习作为突破点,80%的公司考虑放弃预训练策略。 在强化学习领域,Claude Sonnet 3.5和DeepSeek的进展超出了预期,尤其在代码能力和数学推理方面表现出色,展现了单点突破的优势。草莓模型,即OpenAI即将发布的新模型,预计将在未来两周内面世。初步反馈显示其性能虽优于GPT-4o,但在处理简短查询时表现欠佳,速度较慢,且缺乏图像集成功能。此外,草莓模型将采用高级定价策略,预计定价为每月200美元,相较于之前传闻的2000美元,相对更为亲民。 ChatGPT Pro订阅计划的推出,售价200美元/月,提供无限制使用GPT-4o的功能,但并无其他额外服务。市场普遍认为,草莓模型的价格可能是此次订阅升级的关键因素。草莓模型旨在通过自玩强化学习(Self-play RL)方法提升数学、代码能力,实现高度智能化,但其高昂的价格反映了更高智能的开发成本和数据价值。随着OpenAI即将在11月的开发者日公布更多细节,今年AI行业的动向将成为关注焦点,或将成为新的里程碑或平淡无奇。
原文链接
本文链接:https://kx.umi6.com/article/6227.html
转载请注明文章出处
相关推荐
换一换
最新 AGI 暴论:强化学习的「GPT-3 时刻」实现,还需要 1 万年?
2025-07-14 17:29:16
MiniMax海螺视频团队首次开源:Tokenizer也具备明确的Scaling Law
2025-12-22 13:45:27
字节&MAP重塑大模型推理算法优化重点,强化学习重在高效探索助力LLM提升上限
2025-08-11 10:59:04
Nature封面文章: DeepSeek-R1通过强化学习激励的LLM推理
2025-09-18 08:48:39
QwenLong-L1-32B 模型登场:阿里通义千问首个强化学习训练的长文本推理 AI 模型
2025-05-27 14:51:28
奖励模型也能Scaling!上海AI Lab突破强化学习短板,提出策略判别学习新范式
2025-07-11 11:34:40
带图推理碾压同类开源模型!港中文微软等开源OpenThinkIMG框架
2025-05-17 13:06:23
奥尔特曼:感受不到 GPT-5 变强,是因为你还不够「专业」
2025-10-05 20:24:55
Pokee.ai 朱哲清:用 RL 搭建智能体的「骨骼与神经」| AI 产品十人谈
2025-05-08 11:29:43
机器狗能打羽毛球:仅靠强化学习从 0 自学,还会自己移步
2025-05-30 17:53:28
Meta万引强化学习大佬跑路!用小扎原话作为离别寄语,扎心了
2025-08-26 13:43:07
Scaling Law首次在自动驾驶赛道被验证!小鹏汽车CVPR演讲详解
2025-06-16 14:08:23
西交大 x A*STAR 论文:让 AI 学会「保持一致」,多图生成迎来关键突破丨CVPR 2026
2026-03-24 11:45:18
787 文章
715334 浏览
24小时热文
更多
-
2026-06-09 07:06:40 -
2026-06-09 00:54:40 -
2026-06-09 00:53:08