斯坦福大学和华盛顿大学的研究团队仅花费不到50美元的云计算费用,训练出名为s1的人工智能模型,其在数学和编程测试中的表现与OpenAI的o1和DeepSeek的r1相似。s1通过“蒸馏”技术从谷歌的Gemini 2.0 Flash Thinking Experimental模型中学习,该技术使模型能模仿高级推理能力。研究人员使用1000个精心策划的问题和答案进行训练,s1在某些基准测试中表现良好。此低成本训练引发关于人工智能模型商品化的讨论,大型科技公司可能面临挑战。s1模型及相关数据已在GitHub上开源。
原文链接
本文链接:https://kx.umi6.com/article/12664.html
转载请注明文章出处
相关推荐
.png)
换一换
解构Manus AI:这是通用Agent革命,还是精巧缝合怪?
2025-03-08 16:59:56
OpenAI更新推理模型o3-mini思维链
2025-02-07 10:54:40
法国 AI 实验室 Mistral 推出推理模型 Magistral 系列,Small 版已开源
2025-06-11 09:04:46
453 文章
84354 浏览
24小时热文
更多

-
2025-07-21 11:21:54
-
2025-07-21 11:20:45
-
2025-07-21 11:19:36