1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

有道14B低成本轻量模型“子曰3”开源,数学推理性能超越大模型

6月23日,网易有道宣布开源“子曰3”系列大模型中的数学模型(英文名Confucius3-Math),这是国内首个专注于数学教育且能在单块消费级GPU上高效运行的开源推理模型。该模型在多项数学推理任务中表现优异,超越了许多更大规模的通用模型。

“子曰3数学模型”在解决国内数学问题时展现出显著优势,通过大规模增强学习及创新算法,其训练成本仅2.6万美元,推理性能却是DeepSeek R1的15倍。测试显示,在CK12-math、GAOKAO-Bench(Math)、MathBench(K12)、MATH500等数据集上,14B轻量级模型的各项得分均高于DeepSeek-R1等通用大模型。尤其在GAOKAO-Bench(Math)中,得分高达98.5分。

此外,“子曰3数学模型”具有显著的成本优势,可在消费级GPU上运行,大幅降低教育场景下的AI应用门槛。传统教育面临资源不平等等挑战,而高性能大模型的高成本让许多地区难以承担。“子曰3数学模型”将部署成本降至每百万token 0.15美元,远超多数通用大模型,使更多机构和开发者能以低成本部署专业级数学AI应用。

网易有道首席科学家段亦涛指出,“子曰3数学模型”证明了在低成本下构建强大推理模型的可能性,为垂类推理大模型研发提供重要参考。自推出国内首个教育大模型“子曰”以来,有道不断优化模型,已推出多个垂直应用,并发布了国内首个输出分步讲解的推理模型“子曰-o1”。此次开源标志着“子曰”系列在轻量级模型推理能力上的新突破。

段亦涛强调,AI+教育的目标并非取代教师,而是促进教育公平。他期待“子曰3数学模型”开源后能吸引更多开发者参与,共同挖掘推理模型在教育领域的潜力。

Demo地址:https://confucius.youdao.com/
模型开源地址:https://github.com/netease-youdao/Confucius3-Math
论文地址:https://github.com/netease-youdao/Confucius3-Math/blob/main/Confucius3-Math.pdf

原文链接
本文链接:https://kx.umi6.com/article/20648.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
DeepSeek-Prover-V2 登场:AI 数学推理新王者,88.9% 通过率设新标杆
2025-05-01 10:18:39
超低成本复现QwQ!数学推理模型训练迎来RL暴击,数据代码全开源 | 蚂蚁&清华出品
2025-04-01 11:18:45
大模型刷数学题竟有害?CMU评估20+模型指出训练陷阱
2025-07-08 17:52:09
微软推出 14B 参数小语言模型 Phi-4:专攻数学等领域复杂推理
2024-12-13 13:24:50
谷歌研究:合成数据使大模型数学推理能力提升八倍
2025-04-07 09:47:20
深夜突袭,DeepSeek-Prover-V2加冕数学王者!671B数学推理逆天狂飙
2025-05-05 09:43:44
斯坦福打脸大模型数学水平:题干一改就集体降智,强如o1也失准
2025-01-06 10:19:08
让Qwen2.5 7B超越o1,微软干的!MSRA推出小模型数学推理自我进化新方法
2025-01-10 12:15:13
4B小模型数学推理首超Claude 4,700步RL训练逼近235B性能 | 港大&字节Seed&复旦
2025-07-09 15:04:14
挑战AI数学推理极限!大规模形式化数学基准FormalMATH发布,最强模型成功率仅16%
2025-05-08 09:23:53
TeleAI “复杂推理大模型” 达竞赛级数学表现,评分超 o1-preview
2025-01-26 17:15:51
有道14B低成本轻量模型“子曰3”开源,数学推理性能超越大模型
2025-06-23 17:25:48
苹果新论文证明LLM大模型存在缺陷!没有进行真正的逻辑推理
2024-10-15 17:25:58
24小时热文
更多
扫一扫体验小程序