1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

微软亚洲研究院发布创新算法rStar-Math,通过代码增强CoT和蒙特卡洛树搜索,使小参数模型无需依赖大型模型蒸馏即可实现自我进化。在美国数学竞赛AIME 2024中,rStar-Math平均解决了53.3%的难题,超过OpenAI o1-preview的44.6%。在MATH基准测试中,rStar-Math显著提高了阿里开源模型Qwen2.5-Math的准确率。该算法通过四轮自我进化,结合PPM、MCTS和代码增强CoT,大幅提升了模型的数学推理能力。这表明小模型在创新算法和高质量数据支持下,可媲美甚至超越大型模型。

原文链接
本文链接:https://kx.umi6.com/article/11567.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
Llama版o1来了,来自上海AI Lab,强化学习代码已开源,基于AlphaGo Zero范式
2024-11-05 16:03:16
微软 rStar-Math 技术登场:小语言 AI 模型数学推理从“不及格”一跃成为“优等生”
2025-01-11 12:39:34
让Qwen2.5 7B超越o1,微软干的!MSRA推出小模型数学推理自我进化新方法
2025-01-10 12:15:13
重大突破!微软发布“自我进化”,帮小模型超OpenAI-o1
2025-01-13 10:50:38
北交开源 o1 代码版:强化学习 + 蒙特卡洛树搜索,放出源代码、精选数据集以及衍生模型
2024-12-09 13:27:10
图灵奖得主加持,蒙特卡洛树搜索×扩散模型杀回规划赛道|ICML 2025 Spotlight
2025-08-01 14:00:21
8 年首次大突破:谷歌祭出 Transformer 杀手,掌门人划出 AGI 死线
2025-12-07 15:34:40
联想入股原力聚合机器人科技公司
2025-12-08 11:27:54
微博 CEO 王高飞回应能否让 AI 手机自己发微博:需要确认
2025-12-08 09:17:44
智元第 5000 台人形机器人“灵犀 X2”量产下线,已具备批量出货能力
2025-12-08 17:37:43
马斯克谈每年发射100万吨AI卫星:大规模运行AI最低成本方式
2025-12-08 10:20:50
微软终于听劝一次!Windows 11右键菜单AI操作可彻底移除
2025-12-08 12:28:38
亚马逊CTO:开发者只要能进化绝不会被AI取代
2025-12-07 22:52:28
24小时热文
更多
扫一扫体验小程序