斯坦福大学和华盛顿大学的研究人员以不足50美元的云计算费用,利用阿里云通义千问(Qwen)模型进行微调,训练出了名为s1的人工智能推理模型。该模型在数学和编码能力测试中表现出色,与OpenAI的O1和DeepSeek的R1模型相当。青年AI科学家谢伟迪指出,s1模型的训练仅使用了1000个样本数据,更像是对已有强大能力的通义千问模型进行微调。尽管这种低成本训练展示了AI训练的潜力,但也引发了对AI模型知识产权和伦理问题的讨论。未来,降低成本同时保持高性能仍是AI研究的重要课题。
原文链接
本文链接:https://kx.umi6.com/article/12743.html
转载请注明文章出处
相关推荐
.png)
换一换
李飞飞:公共部门资助,对创新生态至关重要
2025-03-15 21:15:02
李飞飞团队“50美元”复现DeepSeek R1真相:基座为阿里云Qwen模型
2025-02-06 20:39:58
李飞飞在巴黎人工智能大会演讲:共同打造以人为本的人工智能
2025-02-11 15:56:18
545 文章
74727 浏览
24小时热文
更多

-
2025-07-21 19:24:29
-
2025-07-21 19:24:17
-
2025-07-21 19:23:25