1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

近期AI行业动态密集,涉及Scaling Law的困境、强化学习的崭露头角、OpenAI的草莓模型发布预告,以及ChatGPT Pro订阅计划的上线。首先,AI行业的普遍感受是大语言模型的进步停滞,尤其是达到数千亿参数后,成本和难度显著增加,尽管上万亿参数并未带来质变提升。硅谷共识聚焦于强化学习作为突破点,80%的公司考虑放弃预训练策略。 在强化学习领域,Claude Sonnet 3.5和DeepSeek的进展超出了预期,尤其在代码能力和数学推理方面表现出色,展现了单点突破的优势。草莓模型,即OpenAI即将发布的新模型,预计将在未来两周内面世。初步反馈显示其性能虽优于GPT-4o,但在处理简短查询时表现欠佳,速度较慢,且缺乏图像集成功能。此外,草莓模型将采用高级定价策略,预计定价为每月200美元,相较于之前传闻的2000美元,相对更为亲民。 ChatGPT Pro订阅计划的推出,售价200美元/月,提供无限制使用GPT-4o的功能,但并无其他额外服务。市场普遍认为,草莓模型的价格可能是此次订阅升级的关键因素。草莓模型旨在通过自玩强化学习(Self-play RL)方法提升数学、代码能力,实现高度智能化,但其高昂的价格反映了更高智能的开发成本和数据价值。随着OpenAI即将在11月的开发者日公布更多细节,今年AI行业的动向将成为关注焦点,或将成为新的里程碑或平淡无奇。

原文链接
本文链接:https://kx.umi6.com/article/6227.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
Qwen首次公开强化学习核心算法,超越字节GRPO
2025-07-28 15:17:21
突破多模态奖励瓶颈!中科院清华快手联合提出R1-Reward,用强化学习赋予模型长期推理能力
2025-05-08 18:33:15
OpenAI路线遭质疑,Meta研究员:根本无法构建超级智能
2025-06-20 21:05:08
多模态模型学会“按需搜索”,少搜30%还更准!字节&NTU新研究优化多模态模型搜索策略
2025-07-09 14:06:26
从蛰伏到王炸,RL启示录
2025-03-25 19:11:14
GPT-5≈o3.1!OpenAI首次详解思考机制:RL+预训练才是AGI正道
2025-10-20 16:09:01
月之暗面因 DeepSeek 调整工作重心?内部人士:强化学习或许会是个方向
2025-02-15 18:07:16
未来的科技历史,将如何发展?
2025-03-07 10:03:26
训练时间减半,性能不降反升!腾讯混元开源图像生成高效强化方案MixGRPO
2025-08-02 18:22:54
Claude 4如何思考?资深研究员回应:RLVR已在编程/数学得到验证
2025-05-24 15:19:19
RL 是推理神器?清华上交大最新研究指出:RL 让大模型更会“套公式”、却不会真推理
2025-04-23 11:57:26
发自 凹非寺量子位 | 公众号 QbitAI 奥特曼点名表扬了两个波兰人。 没有他们,OpenAI就不是今天的样子。 他们是OpenAI首席科学家Jakub Pachocki以及头衔为“Technical Fellow”的Szymon Sidor。 △左:Jakub Pachocki,右:Szymon Sidor 两人不仅是波兰老乡,而且是高中同学,读博时分别选择了计算机科学和机器人,后来又在OpenAI重聚。 在ChatGPT风靡全球、每天服务数亿用户的今天,奥特曼感慨大多数人永远不会想到背
2025-09-09 18:18:27
缺数据也能拿SOTA?清华&上海AI Lab破解机器人RL两大瓶颈
2025-09-26 11:24:15
24小时热文
更多
扫一扫体验小程序