斯坦福大学和华盛顿大学的研究团队仅花费不到50美元的云计算费用,训练出名为s1的人工智能模型,其在数学和编程测试中的表现与OpenAI的o1和DeepSeek的r1相似。s1通过“蒸馏”技术从谷歌的Gemini 2.0 Flash Thinking Experimental模型中学习,该技术使模型能模仿高级推理能力。研究人员使用1000个精心策划的问题和答案进行训练,s1在某些基准测试中表现良好。此低成本训练引发关于人工智能模型商品化的讨论,大型科技公司可能面临挑战。s1模型及相关数据已在GitHub上开源。
原文链接
本文链接:https://kx.umi6.com/article/12664.html
转载请注明文章出处
相关推荐
换一换
o3并非独门秘技,谷歌已发背后关键机制,方法更简单、成本更低
2024-12-23 15:56:25
国产六大推理模型激战OpenAI?
2025-04-25 10:03:41
OpenAI上架推理模型o3-mini 首次向免费用户开放推理功能
2025-02-01 05:13:09
OpenAI o3 AI 推理模型成关键“侦探”,发现 Linux 内核高危漏洞
2025-05-30 11:50:26
机构:蒸馏技术大幅降低开发成本 有望加速AI应用实际落地
2025-02-01 15:27:27
阿里Qwen团队发布新推模型QwQ 会展示完整的思维链
2025-02-25 12:56:25
MiniMax正暗戳戳憋大招
2025-06-02 07:30:05
美团发布高效推理模型 LongCat-Flash-Thinking,达到 SOTA 水平
2025-09-22 15:58:35
秘塔 AI 接入满血版 DeepSeek R1 推理模型
2025-02-03 11:04:51
DeepSeek小心,帝国反击战打响了
2025-02-26 22:53:26
性能比肩 Gemini-2.5 pro、o4-mini:阿里通义千问 Qwen 3 推理模型超级进化,现已开源
2025-07-26 00:31:49
OpenAI的o3正式登场,我们总结了这7个最关键的信息点
2025-04-17 15:41:46
MiniMax开源首个推理模型M1
2025-06-17 10:22:32
673 文章
455066 浏览
24小时热文
更多
-
2026-01-23 06:34:26 -
2026-01-23 00:20:44 -
2026-01-22 23:18:34