DeepSeek-R1 论文登上《自然》封面，通讯作者为梁文锋

2025-09-18 09:48:42

E-Poet

发布在

快讯

阅读：315

正文：9月18日，DeepSeek团队的研究论文《DeepSeek-R1》登上国际权威期刊《自然》第645期封面，通讯作者为梁文锋。这是全球首个经过同行评审的主流大语言模型，填补了该领域的空白。论文指出，当前AI推理能力依赖大量人工标注数据，且复杂问题处理能力有限。研究提出一种纯强化学习框架，可激发大型语言模型自主形成高级推理模式，如自我反思、验证和动态策略调整。经训练的模型在数学、编程竞赛及STEM领域表现优于传统监督学习模型，并能提升小型模型的推理能力。

原文链接

本文链接：https://kx.umi6.com/article/25418.html

转载请注明文章出处

DeepSeek-R1