重大突破！微软发布“自我进化”，帮小模型超OpenAI-o1

2025-01-13 10:50:38

智慧轨迹

发布在

快讯

阅读：479

微软亚洲研究院发布创新算法rStar-Math，通过代码增强CoT和蒙特卡洛树搜索，使小参数模型无需依赖大型模型蒸馏即可实现自我进化。在美国数学竞赛AIME 2024中，rStar-Math平均解决了53.3%的难题，超过OpenAI o1-preview的44.6%。在MATH基准测试中，rStar-Math显著提高了阿里开源模型Qwen2.5-Math的准确率。该算法通过四轮自我进化，结合PPM、MCTS和代码增强CoT，大幅提升了模型的数学推理能力。这表明小模型在创新算法和高质量数据支持下，可媲美甚至超越大型模型。

原文链接

本文链接：https://kx.umi6.com/article/11567.html

转载请注明文章出处

rStar-Math