1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

昆仑万维「天工大模型4.0」o1版(Skywork o1)正式启动邀请测试

今天,昆仑万维推出了具有复杂推理能力的系列模型——「天工大模型4.0」o1版(Skywork o1),这是国内首款具备中文逻辑推理能力的o1模型。

不同于现有复现OpenAI o1模型的工作,Skywork o1不仅在模型输出上内生了思考、计划、反思等能力,还在标准评测集中大幅提升了推理能力。团队采用的复现o1的技术路线,使初始推理能力较差的基座模型在基准测试中成为生态位SOTA。

此次发布的Skywork o1包括三款模型:

  • Skywork o1 Open:基于Llama 3.1 8B的开源模型,评测指标大幅提升,解锁了复杂数学任务。
  • Skywork o1 Lite:具备完整思考能力,中文支持更好,推理和思考速度快,在数学、中文逻辑和推理问题上表现突出。
  • Skywork o1 Preview:完整版推理模型,搭配自研线上推理算法,思考过程多样且深入,推理质量更高。

开源的Skywork o1 Open在数学和代码指标上大幅提升,解锁了GPT 4o无法完成的数学推理任务。此外,还开源了两个推理任务的Process Reward Model(PRM):Skywork o1 Open-PRM-1.5B 和Skywork o1 Open-PRM-7B,能够对模型回答中的每个步骤进行评分。

Skywork o1的推理能力显著提升,得益于天工三阶段自研训练方案:

  • 推理反思能力训练:通过多智能体体系构造高质量的分步思考、反思和验证数据。
  • 推理能力强化学习:利用Skywork o1 Process Reward Model(PRM)捕捉复杂推理任务中间步骤对最终答案的影响。
  • 推理planning:基于天工自研Q*算法进行在线推理,提升推理能力。

Skywork o1模型具备模型思考和规划能力、自我反思能力和自我验证能力。在多种复杂任务中表现出色,如考研数学、比大小、中文逻辑推理、24点计算、竞赛数学、密码解密和智力问答等。此外,它还能处理有趣的“弱智”问题,分析头头是道。

未来,Skywork o1将在中英文逻辑推理、复杂任务、高质量内容生成和深度搜索等领域发挥重要作用。昆仑万维将继续致力于通用人工智能的发展,推动AI技术的全面进步。

测试地址: - 尝鲜地址:www.tiangong.cn - 阅读原文:点击下方链接直接进入网址

(注:原文中的图片和链接未包含在内)

原文链接
本文链接:https://kx.umi6.com/article/9346.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
华为盘古718B模型最新成绩:开源第二
2025-09-29 13:08:42
杨植麟被梁文锋叫醒了!Kimi新模型发布即开源,1T参数全线SOTA
2025-07-12 13:50:53
DeepSeek终于把OpenAI逼急了
2025-08-06 16:35:39
“开源王者”Llama4,却让DeepSeek们松了一口气
2025-04-07 08:47:00
对话朱啸虎:搬离中国,假装不是中国AI创业公司,是没有用的
2025-09-20 20:35:10
群核科技升级空间智能战略,发布两款空间开源模型
2025-08-25 17:31:32
最强3B「小钢炮」,代码数据全公开!推理随意开关,128k超长上下文
2025-07-11 11:34:58
开源全能图像模型媲美GPT-4o!解决扩散模型误差累计问题
2025-05-12 16:35:41
刚刚,OpenAI发布2款开源模型,手机笔记本也能跑,北大校友扛大旗
2025-08-06 07:23:51
2025年度最全面的AI报告:谁在赚钱,谁爱花钱,谁是草台班子
2025-10-13 17:00:38
美国“SPAC之王”查马斯:公司已转用Kimi K2
2025-10-11 19:32:28
持续拥抱开源 腾讯混元一口气开源四款小尺寸模型 最小仅0.5B
2025-08-04 18:06:55
抢跑GPT-5,智谱开源新SOTA模型,一句话搞出能看视频、发弹幕的B站!
2025-07-29 00:21:11
24小时热文
更多
扫一扫体验小程序