上海AI Lab研发出名为MCTSr的8B参数数学模型,凭借蒙特卡洛算法和Llama 3技术,在奥赛级别数学题上达到与GPT-4相当的准确率。模型仅用1/200参数量,通过自我修正和评估,展示出小模型在数学上的强大性能,挑战了传统观点。研究团队在GSM-8K和MATH测试中,随着自我优化轮数增加,模型表现持续提升,甚至在新发布的Math Odyssey数据集上展现泛化能力。MCTSr代码已开源,可于GitHub获取。
原文链接
本文链接:https://kx.umi6.com/article/1575.html
转载请注明文章出处
相关推荐
换一换
OpenAI o1 全方位 SOTA 登顶 lmsys 排行榜:数学能力碾压 Claude 和谷歌 Gemini 模型,o1-mini 并列第一
2024-09-20 14:20:11
Qwen2-Math 开源 AI 模型发布:阿里通义千问家族新成员,数学能力超 GPT-4o
2024-08-09 10:57:07
科大讯飞星火 X1 模型升级,数学能力全面对标 DeepSeek R1 和 OpenAI o1
2025-03-03 10:16:41
谷歌杀回来了,新版Gemini跑分超o1登顶第一
2024-11-15 18:02:26
OpenAI 研究人员夸大 GPT-5 数学能力后删帖,遭杨立昆等业界人士批评
2025-10-19 08:45:17
监督学习也能从错误中学习反思?!清华英伟达联合提出隐式负向策略爆炸提升数学能力
2025-06-22 14:17:41
英特尔第一季度营收136亿美元 同比增长7.2%
2026-04-24 08:00:05
行业景气度高位运行 光模块企业扩产忙
2026-04-23 07:55:30
国家知识产权局:将积极完善新兴领域知识产权保护制度
2026-04-23 17:20:53
SK海力士完成采购项目的招标 涉及250台人工智能服务器
2026-04-23 16:18:31
广东:运用人工智能技术优化芯片设计、制造全流程
2026-04-22 17:29:07
昇腾超节点系列产品全面支持DeepSeek V4新模型
2026-04-24 13:15:05
国家人工智能产业投资基金等入股黑湖科技
2026-04-23 11:03:52
702 文章
588023 浏览
24小时热文
更多
-
2026-04-24 16:22:09 -
2026-04-24 16:21:03 -
2026-04-24 16:19:57