昆仑万维「天工大模型4.0」o1版（Skywork o1）正式启动邀请测试

2024-11-27 14:53:32

E-Poet

发布在

科普

阅读：763

昆仑万维「天工大模型4.0」o1版（Skywork o1）正式启动邀请测试

今天，昆仑万维推出了具有复杂推理能力的系列模型——「天工大模型4.0」o1版（Skywork o1），这是国内首款具备中文逻辑推理能力的o1模型。

不同于现有复现OpenAI o1模型的工作，Skywork o1不仅在模型输出上内生了思考、计划、反思等能力，还在标准评测集中大幅提升了推理能力。团队采用的复现o1的技术路线，使初始推理能力较差的基座模型在基准测试中成为生态位SOTA。

此次发布的Skywork o1包括三款模型：

Skywork o1 Open：基于Llama 3.1 8B的开源模型，评测指标大幅提升，解锁了复杂数学任务。
Skywork o1 Lite：具备完整思考能力，中文支持更好，推理和思考速度快，在数学、中文逻辑和推理问题上表现突出。
Skywork o1 Preview：完整版推理模型，搭配自研线上推理算法，思考过程多样且深入，推理质量更高。

开源的Skywork o1 Open在数学和代码指标上大幅提升，解锁了GPT 4o无法完成的数学推理任务。此外，还开源了两个推理任务的Process Reward Model（PRM）：Skywork o1 Open-PRM-1.5B 和Skywork o1 Open-PRM-7B，能够对模型回答中的每个步骤进行评分。

Skywork o1的推理能力显著提升，得益于天工三阶段自研训练方案：