1月10日,微软亚洲研究院发布rStar-Math技术,该技术专用于解决数学问题,采用蒙特卡洛树搜索方法。研究人员通过训练“策略模型”和“过程偏好模型”,提升了小语言AI模型的数学推理能力。测试显示,Qwen2.5-Math-7B模型准确率从58.8%提升至90.0%,Phi3-mini-3.8B模型从41.4%提升至86.4%,优于OpenAI的o1-preview模型。研究团队计划在GitHub上公开rStar-Math的代码和数据。
原文链接
本文链接:https://kx.umi6.com/article/11518.html
转载请注明文章出处
相关推荐
.png)
换一换
微软 rStar-Math 技术登场:小语言 AI 模型数学推理从“不及格”一跃成为“优等生”
2025-01-11 12:39:34
大模型刷数学题竟有害?CMU评估20+模型指出训练陷阱
2025-07-08 17:52:09
深夜突袭,DeepSeek-Prover-V2加冕数学王者!671B数学推理逆天狂飙
2025-05-05 09:43:44
420 文章
73879 浏览
24小时热文
更多

-
2025-07-21 14:20:17
-
2025-07-21 14:19:09
-
2025-07-21 14:18:00