DeepSeek-R1 最新发布，剑指 OpenAI o1

2025-01-22 10:55:31

AGI探路者

发布在

快讯

阅读：1224

昨日1月20日，DeepSeek团队发布了全新开源模型DeepSeek-R1，迅速获得4k+星。该模型打破了传统训练模式，未使用SFT数据，仅通过RL训练，展示了自主思考的能力。DeepSeek-R1在多项基准测试中与OpenAI o1不相上下，尤其在数学和编程竞赛中表现出色。模型还开源了多个小模型，参数从1.5B到70B，性能超越GPT-4o等竞品。DeepSeek-R1的训练方法包括Self play、Grpo及Cold start，使其成本仅为o1的五十分之一，效能却相当。

原文链接

本文链接：https://kx.umi6.com/article/11992.html

转载请注明文章出处

DeepSeek-R1