斯坦福大学和华盛顿大学的研究团队仅花费不到50美元的云计算费用,训练出名为s1的人工智能模型,其在数学和编程测试中的表现与OpenAI的o1和DeepSeek的r1相似。s1通过“蒸馏”技术从谷歌的Gemini 2.0 Flash Thinking Experimental模型中学习,该技术使模型能模仿高级推理能力。研究人员使用1000个精心策划的问题和答案进行训练,s1在某些基准测试中表现良好。此低成本训练引发关于人工智能模型商品化的讨论,大型科技公司可能面临挑战。s1模型及相关数据已在GitHub上开源。
原文链接
本文链接:https://kx.umi6.com/article/12664.html
转载请注明文章出处
相关推荐
换一换
国产六大推理模型激战OpenAI?
2025-04-25 10:03:41
DeepSeek的挑战来了!AI教母李飞飞用不到50美元训练出新模型
2025-02-07 10:51:30
Mistral 将推出其首个推理模型 Magistral,与 OpenAI 和 DeepSeek 展开竞争
2025-06-10 18:53:38
法国 AI 实验室 Mistral 推出推理模型 Magistral 系列,Small 版已开源
2025-06-11 09:04:46
阿里云通义发布首个多模态推理模型QVQ
2024-12-25 13:05:41
OpenAI 最强推理模型、能够“思考”图片,o3 和 o4-mini 正式发布
2025-04-17 02:19:26
法国人工智能公司Mistral发布首个推理模型 支持欧洲多种语言
2025-06-10 20:54:31
什么是真正好用的推理模型?阶跃Step 3:开源的,多模态的,低成本的,国产芯片适配的
2025-07-28 10:09:36
o3-pro答高难题文字游戏引围观,OpenAI前员工讽刺苹果:这都不叫推理那什么叫推理
2025-06-13 12:06:17
阿里通义千问推出全新推理模型 Qwen3-30B-A3B-Thinking-2507,多项能力显著提升
2025-07-31 07:59:58
OpenAI最强推理模型o3发布,首次能用图片思考
2025-04-17 09:29:43
OpenAI的o3正式登场,我们总结了这7个最关键的信息点
2025-04-17 15:41:46
一文看懂OpenAI最强模型o1:怎么用好,为何翻车?
2024-09-20 18:22:13
709 文章
511891 浏览
24小时热文
更多
-
2026-03-10 13:19:24 -
2026-03-10 13:18:55 -
2026-03-10 12:13:43