斯坦福大学和华盛顿大学的研究团队仅花费不到50美元的云计算费用,训练出名为s1的人工智能模型,其在数学和编程测试中的表现与OpenAI的o1和DeepSeek的r1相似。s1通过“蒸馏”技术从谷歌的Gemini 2.0 Flash Thinking Experimental模型中学习,该技术使模型能模仿高级推理能力。研究人员使用1000个精心策划的问题和答案进行训练,s1在某些基准测试中表现良好。此低成本训练引发关于人工智能模型商品化的讨论,大型科技公司可能面临挑战。s1模型及相关数据已在GitHub上开源。
原文链接
本文链接:https://kx.umi6.com/article/12664.html
转载请注明文章出处
相关推荐
.png)
换一换
财跃星辰CTO白祚:推理模型将快速迭代到Agent模型
2025-02-23 19:04:12
武汉人工智能研究院院长王金桥:未来大模型战场将转向推理模型| AI领先者心声・2025
2025-01-06 16:36:35
OpenAI o1 推理过程出现中文,专家解读 AI 可能只想用最高效的语言来思考
2025-01-15 11:33:15
秘塔 AI 接入满血版 DeepSeek R1 推理模型
2025-02-03 11:04:51
OpenAI o3 AI 推理模型成关键“侦探”,发现 Linux 内核高危漏洞
2025-05-30 11:50:26
字节新推理模型逆袭DeepSeek,200B参数战胜671B,豆包史诗级加强?
2025-04-11 14:49:21
阿里云通义发布首个多模态推理模型QVQ
2024-12-25 13:05:41
OpenAI两大推理模型,要把Agent吞进模型里了
2025-04-17 12:36:09
训练成本不到 50 美元,研究人员打造出媲美 OpenAI o1 的推理模型
2025-02-06 09:25:10
OpenAI新推理模型被曝产生更多幻觉
2025-04-21 08:36:41
9个DeepSeek隐藏技巧,让打工人效率翻倍
2025-02-05 08:59:41
OpenAI 最强推理模型、能够“思考”图片,o3 和 o4-mini 正式发布
2025-04-17 02:19:26
OpenAI上架推理模型o3-mini 首次向免费用户开放推理功能
2025-02-01 05:13:09
515 文章
197419 浏览
24小时热文
更多

-
2025-09-10 16:41:49
-
2025-09-10 16:41:04
-
2025-09-10 16:40:43