上海AI Lab研发出名为MCTSr的8B参数数学模型,凭借蒙特卡洛算法和Llama 3技术,在奥赛级别数学题上达到与GPT-4相当的准确率。模型仅用1/200参数量,通过自我修正和评估,展示出小模型在数学上的强大性能,挑战了传统观点。研究团队在GSM-8K和MATH测试中,随着自我优化轮数增加,模型表现持续提升,甚至在新发布的Math Odyssey数据集上展现泛化能力。MCTSr代码已开源,可于GitHub获取。
原文链接
本文链接:https://kx.umi6.com/article/1575.html
转载请注明文章出处
相关推荐
换一换
OpenAI 研究人员夸大 GPT-5 数学能力后删帖,遭杨立昆等业界人士批评
2025-10-19 08:45:17
Qwen2-Math 开源 AI 模型发布:阿里通义千问家族新成员,数学能力超 GPT-4o
2024-08-09 10:57:07
监督学习也能从错误中学习反思?!清华英伟达联合提出隐式负向策略爆炸提升数学能力
2025-06-22 14:17:41
谷歌杀回来了,新版Gemini跑分超o1登顶第一
2024-11-15 18:02:26
科大讯飞星火 X1 模型升级,数学能力全面对标 DeepSeek R1 和 OpenAI o1
2025-03-03 10:16:41
OpenAI o1 全方位 SOTA 登顶 lmsys 排行榜:数学能力碾压 Claude 和谷歌 Gemini 模型,o1-mini 并列第一
2024-09-20 14:20:11
微信AI自动模式开启内测!用户一句话 可直接操作小程序页面
2026-06-08 17:42:03
扣子3.0实测:手机就能远程遥控你电脑里的Agent
2026-06-04 09:58:01
CVPR 2026 | 支撑春晚合肥 7 分钟的4K画面奇观 PS-SR让视频超分不用在速度与质量间为难
2026-06-08 11:24:08
AI“吹大”的美股泡沫有多大?高盛:确有过热 但未至历史极端水平
2026-06-08 16:35:40
从看懂世界到做对动作,卧安机器人OneModel 1.7用一条「隐式通路」打通了具身智能的关键断层
2026-06-03 20:34:55
刚刚,李飞飞亲自下场定义世界模型
2026-06-04 09:56:31
国星宇航与腾讯云签署“星算”计划战略合作协议,携手领航AI云服务新生态
2026-06-05 18:10:37
722 文章
671914 浏览
24小时热文
更多
-
2026-06-09 00:54:40 -
2026-06-09 00:53:08 -
2026-06-08 23:49:41