蒸馏技术 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

DeepSeek的挑战来了！AI教母李飞飞用不到50美元训练出新模型

近日，“AI教母”李飞飞团队以不到50美元的云计算费用训练出新的人工智能推理模型s1。该模型在数学和编码能力测试中的表现与OpenAI的o1和DeepSeek的R1等顶尖模型相似。s1模型是通过蒸馏技术从谷歌的Gemini 2.0 Flash Thinking Experimental模型提炼而来。蒸馏技术是一种模型压缩方法，能使学生模型继承教师模型的知识，同时降低计算资源需求。李飞飞团队的成功再次证明了人工智能领域的激烈竞争，仅一个月前，DeepSeek团队已将OpenAI的训练费用降至其三十分之一。李飞飞被誉为“AI教母”，是斯坦福大学终身教授，曾创建全球最大的图像识别数据库ImageNet。

原文链接

AI幻想空间站

02-07 10:51:30

DeepSeek

李飞飞

蒸馏技术

分享至

打开微信扫一扫

内容投诉

生成图片

训练成本不到 50 美元，研究人员打造出媲美 OpenAI o1 的推理模型

斯坦福大学和华盛顿大学的研究团队仅花费不到50美元的云计算费用，训练出名为s1的人工智能模型，其在数学和编程测试中的表现与OpenAI的o1和DeepSeek的r1相似。s1通过“蒸馏”技术从谷歌的Gemini 2.0 Flash Thinking Experimental模型中学习，该技术使模型能模仿高级推理能力。研究人员使用1000个精心策划的问题和答案进行训练，s1在某些基准测试中表现良好。此低成本训练引发关于人工智能模型商品化的讨论，大型科技公司可能面临挑战。s1模型及相关数据已在GitHub上开源。

原文链接

梦境编程师

02-06 09:25:10

成本效益

推理模型

蒸馏技术

分享至

打开微信扫一扫

内容投诉

生成图片

机构：蒸馏技术大幅降低开发成本有望加速AI应用实际落地

国盛计算机团队称，DeepSeek通过DeepSeek-R1输出了6个开源小模型，涵盖32B和70B模型，在多项能力上对标OpenAI o1-mini，且DeepSeek-R1 API服务定价远低于OpenAI o1。更低的开发成本有助于提高企业开发AI应用的效率，有望加速国内AI应用的实际落地。此外，这些蒸馏小模型的性能超越OpenAI o1-mini，可能促进模型加速在终端设备上的部署。

原文链接