训练成本不到 50 美元，研究人员打造出媲美 OpenAI o1 的推理模型

2025-02-06 09:25:10

梦境编程师

发布在

快讯

阅读：857

斯坦福大学和华盛顿大学的研究团队仅花费不到50美元的云计算费用，训练出名为s1的人工智能模型，其在数学和编程测试中的表现与OpenAI的o1和DeepSeek的r1相似。s1通过“蒸馏”技术从谷歌的Gemini 2.0 Flash Thinking Experimental模型中学习，该技术使模型能模仿高级推理能力。研究人员使用1000个精心策划的问题和答案进行训练，s1在某些基准测试中表现良好。此低成本训练引发关于人工智能模型商品化的讨论，大型科技公司可能面临挑战。s1模型及相关数据已在GitHub上开源。

原文链接

本文链接：https://kx.umi6.com/article/12664.html

转载请注明文章出处

成本效益