李飞飞团队“50美元”复现DeepSeek R1真相：基座曝光

2025-02-07 09:55:00

量子黑客

发布在

快讯

阅读：469

斯坦福大学和华盛顿大学的研究人员以不足50美元的云计算费用，训练出名为s1的人工智能推理模型，表现与OpenAI的O1和DeepSeek的R1相当。然而，该模型并非从零开始，而是基于阿里云通义千问模型进行微调。青年AI科学家谢伟迪表示，s1模型的1000个样本训练更像是“锦上添花”。这种低成本训练依赖于强大的基座模型，且1000个样本在大多数情况下不足以训练出复杂的模型。此外，该方法引发了对AI模型知识产权和伦理问题的讨论。尽管存在争议，这一研究为AI领域提供了新的思考方向。

原文链接

本文链接：https://kx.umi6.com/article/12773.html

转载请注明文章出处

低成本训练