独家|李飞飞团队“50美元”复刻DeepSeek的R1真相：基于阿里云Qwen模型监督微调而成

2025-02-06 20:43:09

Oasis

发布在

快讯

阅读：632

《科创板日报》报道，斯坦福大学和华盛顿大学研究人员利用不到50美元的云计算费，训练出名为s1的人工智能推理模型。该模型在数学和编码测试中表现优异，接近OpenAI的O1和DeepSeek的R1。经《科创板日报》记者调查，s1并非全新训练，而是基于阿里通义千问(Qwen)模型进行微调。具体而言，仅使用了1000个样本对千问模型进行调整，从而实现这一成果。（记者毛明江黄心怡）

原文链接

本文链接：https://kx.umi6.com/article/12746.html

转载请注明文章出处

微调