
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
近日,“AI教母”李飞飞团队以不到50美元的云计算费用训练出新的人工智能推理模型s1。该模型在数学和编码能力测试中的表现与OpenAI的o1和DeepSeek的R1等顶尖模型相似。s1模型是通过蒸馏技术从谷歌的Gemini 2.0 Flash Thinking Experimental模型提炼而来。蒸馏技术是一种模型压缩方法,能使学生模型继承教师模型的知识,同时降低计算资源需求。李飞飞团队的成功再次证明了人工智能领域的激烈竞争,仅一个月前,DeepSeek团队已将OpenAI的训练费用降至其三十分之一。李飞飞被誉为“AI教母”,是斯坦福大学终身教授,曾创建全球最大的图像识别数据库ImageNet。
原文链接
斯坦福大学和华盛顿大学的研究团队仅花费不到50美元的云计算费用,训练出名为s1的人工智能模型,其在数学和编程测试中的表现与OpenAI的o1和DeepSeek的r1相似。s1通过“蒸馏”技术从谷歌的Gemini 2.0 Flash Thinking Experimental模型中学习,该技术使模型能模仿高级推理能力。研究人员使用1000个精心策划的问题和答案进行训练,s1在某些基准测试中表现良好。此低成本训练引发关于人工智能模型商品化的讨论,大型科技公司可能面临挑战。s1模型及相关数据已在GitHub上开源。
原文链接
国盛计算机团队称,DeepSeek通过DeepSeek-R1输出了6个开源小模型,涵盖32B和70B模型,在多项能力上对标OpenAI o1-mini,且DeepSeek-R1 API服务定价远低于OpenAI o1。更低的开发成本有助于提高企业开发AI应用的效率,有望加速国内AI应用的实际落地。此外,这些蒸馏小模型的性能超越OpenAI o1-mini,可能促进模型加速在终端设备上的部署。
原文链接
加载更多

暂无内容