1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

最强32B中文推理大模型易主:开源免费商用,参数量仅为DeepSeek-R1的1/20

日前,一款新的32B参数量中文推理大模型Skywork-OR1 (Open Reasoner 1) 系列正式亮相。该系列模型不仅免费商用,还全面开源,包括模型权重、训练数据集和完整训练代码。

Skywork-OR1系列涵盖三款模型:Skywork-OR1-Math-7B专注于数学领域,Skywork-OR1-7B-Preview兼具数学与代码能力,而旗舰版本Skywork-OR1-32B-Preview则面向高复杂度任务。其中,32B版本在推理能力上超越同规模的阿里QwQ-32B,代码生成能力媲美DeepSeek-R1,但成本更低。

在数学推理方面,7B和32B版本均达到同规模最优。数学专项模型Skywork-OR1-Math-7B表现尤为突出,在AIME24和AIME25测试中成绩优异,甚至接近蒸馏版Deepseek-32B模型的水平。

团队通过多项技术创新提升了模型性能,包括构建高质量数学和代码数据集、采用多阶段训练方法以及优化强化学习策略。这些努力使Skywork-OR1系列成为当前同规模最强的中文推理模型之一,同时支持免费商用。

目前,Skywork-OR1系列模型已在GitHub和Huggingface平台全面开源。未来,团队还将发布更完善的正式版本,并提供更多技术细节供开发者参考。

原文链接
本文链接:https://kx.umi6.com/article/17092.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
在DeepSeek老家发新模型,豆包怎么想的?
2025-04-18 16:15:50
LLM神话破灭?苹果论文最新实锤:难以实现真正智能
2025-06-09 20:34:34
月之暗面 Kimi K2 发布并开源,擅长代码与 Agentic 任务
2025-07-11 23:44:58
24小时热文
更多
扫一扫体验小程序