近日,“AI教母”李飞飞团队以不到50美元的云计算费用训练出新的人工智能推理模型s1。该模型在数学和编码能力测试中的表现与OpenAI的o1和DeepSeek的R1等顶尖模型相似。s1模型是通过蒸馏技术从谷歌的Gemini 2.0 Flash Thinking Experimental模型提炼而来。蒸馏技术是一种模型压缩方法,能使学生模型继承教师模型的知识,同时降低计算资源需求。李飞飞团队的成功再次证明了人工智能领域的激烈竞争,仅一个月前,DeepSeek团队已将OpenAI的训练费用降至其三十分之一。李飞飞被誉为“AI教母”,是斯坦福大学终身教授,曾创建全球最大的图像识别数据库ImageNet。
原文链接
本文链接:https://kx.umi6.com/article/12777.html
转载请注明文章出处
相关推荐
换一换
腾讯与阿里巴巴洽谈投资DeepSeek 估值超过200亿美元
2026-04-22 19:27:03
李飞飞世界模型大更新,实时生成3D世界,只要一块GPU
2025-10-17 13:16:18
DeepSeek发布Agent Harness相关岗位 或推智能体产品
2026-05-20 16:47:33
DeepSeek上线专家模式
2026-04-08 08:44:08
DeepSeek线上模型升级:当前版本号 DeepSeek-V3.1-Terminus
2025-09-22 21:05:30
DeepSeek母公司去年进账50亿,够烧2380个R1
2026-01-13 16:43:30
DeepSeek发布新论文提出更为高效的AI开发方法
2026-01-02 18:32:56
智谱创始人唐杰谈 DeepSeek:很震撼,开启了“AI 做事”新范式
2026-01-12 09:23:20
DeepSeek新论文剧透V4新框架!用闲置网卡加速智能体推理性能
2026-02-27 16:53:38
六大AI模型被扔进加密市场厮杀,DeepSeek暂为交易之王
2025-10-20 18:12:39
黄仁勋新年第一场演讲提了DeepSeek 推动了整个行业变革
2026-01-06 08:54:05
DeepSeek 出现服务故障:网页 / API 性能异常,已进行修复
2025-11-25 16:59:50
DeepSeek 开年发布新论文:提出全新 mHC 架构,梁文锋现身作者名单
2026-01-01 17:23:53
738 文章
640654 浏览
24小时热文
更多
-
2026-06-09 07:06:40 -
2026-06-09 00:54:40 -
2026-06-09 00:53:08