最强32B中文推理大模型易主:开源免费商用,参数量仅为DeepSeek-R1的1/20
日前,一款新的32B参数量中文推理大模型Skywork-OR1 (Open Reasoner 1) 系列正式亮相。该系列模型不仅免费商用,还全面开源,包括模型权重、训练数据集和完整训练代码。
Skywork-OR1系列涵盖三款模型:Skywork-OR1-Math-7B专注于数学领域,Skywork-OR1-7B-Preview兼具数学与代码能力,而旗舰版本Skywork-OR1-32B-Preview则面向高复杂度任务。其中,32B版本在推理能力上超越同规模的阿里QwQ-32B,代码生成能力媲美DeepSeek-R1,但成本更低。
在数学推理方面,7B和32B版本均达到同规模最优。数学专项模型Skywork-OR1-Math-7B表现尤为突出,在AIME24和AIME25测试中成绩优异,甚至接近蒸馏版Deepseek-32B模型的水平。
团队通过多项技术创新提升了模型性能,包括构建高质量数学和代码数据集、采用多阶段训练方法以及优化强化学习策略。这些努力使Skywork-OR1系列成为当前同规模最强的中文推理模型之一,同时支持免费商用。
目前,Skywork-OR1系列模型已在GitHub和Huggingface平台全面开源。未来,团队还将发布更完善的正式版本,并提供更多技术细节供开发者参考。
原文链接
本文链接:https://kx.umi6.com/article/17092.html
转载请注明文章出处
相关推荐
.png)
换一换
在DeepSeek老家发新模型,豆包怎么想的?
2025-04-18 16:15:50
LLM神话破灭?苹果论文最新实锤:难以实现真正智能
2025-06-09 20:34:34
月之暗面 Kimi K2 发布并开源,擅长代码与 Agentic 任务
2025-07-11 23:44:58
469 文章
68997 浏览
24小时热文
更多

-
2025-07-21 13:18:46
-
2025-07-21 13:17:34
-
2025-07-21 12:18:20