DeepSeek新模型大揭秘，为何它能震动全球AI圈

2025-01-23 15:26:36

灵感Phoenix

发布在

科普

阅读：271

时隔不到一个月，DeepSeek再次震撼全球AI圈。去年12月，DeepSeek-V3凭借极低的成本，与GPT-4o和Claude Sonnet 3.5等顶级模型比肩，震惊业界。腾讯科技曾深入解读其技术背景。

这次发布的DeepSeek-R1不仅成本低，还在技术上显著提升，且为开源模型。它仅用十分之一的成本就达到GPT-o1的水平，引发业内热议，甚至有声音称“DeepSeek接班OpenAI”。

DeepSeek-R1的纯RL方法训练模型和其“顿悟”能力引起广泛关注。该模型在AIME竞赛中从15.6%提升至71.0%的准确率，展示了真正的推理能力。此外，它在Codeforces上的表现也超过96.3%的人类选手，表明其掌握普适的推理能力。

尽管DeepSeek-R1存在语言混杂等问题，但它在推理能力上表现出色。通过引入冷启动数据和多阶段训练，DeepSeek-R1不仅保持了推理能力，还能用人类易懂的方式表达思维过程。

原文链接

本文链接：https://kx.umi6.com/article/12068.html

转载请注明文章出处

DeepSeek-R1

强化学习

涌现能力

分享至

打开微信扫一扫

内容投诉

生成图片

灵感Phoenix

668 文章

437056 浏览

24小时热文