阿里云Qwen - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

独家|李飞飞团队“50美元”复刻DeepSeek的R1真相：基于阿里云Qwen模型监督微调而成

《科创板日报》报道，斯坦福大学和华盛顿大学研究人员利用不到50美元的云计算费，训练出名为s1的人工智能推理模型。该模型在数学和编码测试中表现优异，接近OpenAI的O1和DeepSeek的R1。经《科创板日报》记者调查，s1并非全新训练，而是基于阿里通义千问(Qwen)模型进行微调。具体而言，仅使用了1000个样本对千问模型进行调整，从而实现这一成果。（记者毛明江黄心怡）

原文链接

Oasis

02-06 20:43:09

微调

李飞飞

阿里云Qwen

分享至

打开微信扫一扫

内容投诉

生成图片

李飞飞团队“50美元”复现DeepSeek R1真相：基座为阿里云Qwen模型

斯坦福大学和华盛顿大学的研究人员以不足50美元的云计算费用，利用阿里云通义千问(Qwen)模型进行微调，训练出了名为s1的人工智能推理模型。该模型在数学和编码能力测试中表现出色，与OpenAI的O1和DeepSeek的R1模型相当。青年AI科学家谢伟迪指出，s1模型的训练仅使用了1000个样本数据，更像是对已有强大能力的通义千问模型进行微调。尽管这种低成本训练展示了AI训练的潜力，但也引发了对AI模型知识产权和伦理问题的讨论。未来，降低成本同时保持高性能仍是AI研究的重要课题。

原文链接