近日,“AI教母”李飞飞团队以不到50美元的云计算费用训练出新的人工智能推理模型s1。该模型在数学和编码能力测试中的表现与OpenAI的o1和DeepSeek的R1等顶尖模型相似。s1模型是通过蒸馏技术从谷歌的Gemini 2.0 Flash Thinking Experimental模型提炼而来。蒸馏技术是一种模型压缩方法,能使学生模型继承教师模型的知识,同时降低计算资源需求。李飞飞团队的成功再次证明了人工智能领域的激烈竞争,仅一个月前,DeepSeek团队已将OpenAI的训练费用降至其三十分之一。李飞飞被誉为“AI教母”,是斯坦福大学终身教授,曾创建全球最大的图像识别数据库ImageNet。
原文链接
本文链接:https://kx.umi6.com/article/12777.html
转载请注明文章出处
相关推荐
换一换
李飞飞一年前究竟说了啥?怎么又火了
2025-09-11 14:55:23
鏖战2025年,大模型围着开源转
2025-12-25 18:55:44
DeepSeek新模型上线
2025-09-30 11:25:43
北大团队改造DeepSeek注意力,速度快四倍还不丢精度
2026-04-07 00:20:16
美国AI巨头炮轰DeepSeek 只为给五角大楼递投名状
2026-02-26 07:32:42
DeepSeek新模型上线!引入DSA新稀疏注意力,还又狙了CUDA一枪
2025-09-29 19:13:01
Similarweb 报告 13 日全球 AI 流量:Gemini 成 ChatGPT 最强劲对手,DeepSeek 正收复失地
2025-11-15 12:48:52
消息称 DeepSeek 正开发更先进模型:具备 AI 智能体能力,剑指年底发布
2025-09-04 18:07:12
DeepSeek一句话让国产芯片集体暴涨!背后的UE8M0 FP8到底是个啥
2025-08-22 14:48:58
DeepSeek 开源新模型 V3.1:约 685B 参数,上下文长度拓展至 128K
2025-08-20 10:11:16
梁文锋,Nature全球年度十大科学人物!
2025-12-09 10:25:17
李飞飞和LeCun的世界模型之争
2025-11-15 16:57:04
Transformer作者:DeepSeek才有搞头,OpenAI指望不上了
2025-09-12 11:09:05
725 文章
559163 浏览
24小时热文
更多
-
2026-04-24 20:31:56 -
2026-04-24 20:29:51 -
2026-04-24 19:29:38