斯坦福大学和华盛顿大学的研究人员以不足50美元的云计算费用,训练出名为s1的人工智能推理模型,表现与OpenAI的O1和DeepSeek的R1相当。然而,该模型并非从零开始,而是基于阿里云通义千问模型进行微调。青年AI科学家谢伟迪表示,s1模型的1000个样本训练更像是“锦上添花”。这种低成本训练依赖于强大的基座模型,且1000个样本在大多数情况下不足以训练出复杂的模型。此外,该方法引发了对AI模型知识产权和伦理问题的讨论。尽管存在争议,这一研究为AI领域提供了新的思考方向。
原文链接
本文链接:https://kx.umi6.com/article/12773.html
转载请注明文章出处
相关推荐
.png)
换一换
阿里云通义千问系列 AI 开源模型升至 Qwen2:5 个尺寸、上下文长度最高支持 128K tokens
2024-06-07 09:04:59
李飞飞团队训练出媲美DeepSeek R1的推理模型 云计算费用不到50美元
2025-02-06 16:39:43
李飞飞带队,World Labs估值70亿
2024-07-20 17:14:18
418 文章
69656 浏览
24小时热文
更多

-
2025-07-21 18:22:40
-
2025-07-21 18:21:33
-
2025-07-21 18:20:19