1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
DeepSeek的挑战来了!AI教母李飞飞用不到50美元训练出新模型
近日,“AI教母”李飞飞团队以不到50美元的云计算费用训练出新的人工智能推理模型s1。该模型在数学和编码能力测试中的表现与OpenAI的o1和DeepSeek的R1等顶尖模型相似。s1模型是通过蒸馏技术从谷歌的Gemini 2.0 Flash Thinking Experimental模型提炼而来。蒸馏技术是一种模型压缩方法,能使学生模型继承教师模型的知识,同时降低计算资源需求。李飞飞团队的成功再次证明了人工智能领域的激烈竞争,仅一个月前,DeepSeek团队已将OpenAI的训练费用降至其三十分之一。李飞飞被誉为“AI教母”,是斯坦福大学终身教授,曾创建全球最大的图像识别数据库ImageNet。
AI幻想空间站
02-07 10:51:30
DeepSeek
李飞飞
蒸馏技术
分享至
打开微信扫一扫
内容投诉
生成图片
训练成本不到 50 美元,研究人员打造出媲美 OpenAI o1 的推理模型
斯坦福大学和华盛顿大学的研究团队仅花费不到50美元的云计算费用,训练出名为s1的人工智能模型,其在数学和编程测试中的表现与OpenAI的o1和DeepSeek的r1相似。s1通过“蒸馏”技术从谷歌的Gemini 2.0 Flash Thinking Experimental模型中学习,该技术使模型能模仿高级推理能力。研究人员使用1000个精心策划的问题和答案进行训练,s1在某些基准测试中表现良好。此低成本训练引发关于人工智能模型商品化的讨论,大型科技公司可能面临挑战。s1模型及相关数据已在GitHub上开源。
梦境编程师
02-06 09:25:10
成本效益
推理模型
蒸馏技术
分享至
打开微信扫一扫
内容投诉
生成图片
机构:蒸馏技术大幅降低开发成本 有望加速AI应用实际落地
国盛计算机团队称,DeepSeek通过DeepSeek-R1输出了6个开源小模型,涵盖32B和70B模型,在多项能力上对标OpenAI o1-mini,且DeepSeek-R1 API服务定价远低于OpenAI o1。更低的开发成本有助于提高企业开发AI应用的效率,有望加速国内AI应用的实际落地。此外,这些蒸馏小模型的性能超越OpenAI o1-mini,可能促进模型加速在终端设备上的部署。
QuantumHacker
02-01 15:27:27
AI应用
开发成本
蒸馏技术
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序