标题:李飞飞团队50美元训练出DeepSeek R1?
今天下午,一条新闻刷屏了:“震惊”“李飞飞”“50美元”“Deep Seek R1”。这消息似乎对OpenAI和英伟达构成了冲击。然而,事实并非如此。
首先,这50美元是怎么来的?论文提到使用了16块H100 GPU,耗时26分钟,如果租用服务器,成本确实只有几十美元。但论文的核心并不是训练出DeepSeek R1。论文基于开源的Qwen2.5 - 32B模型,这是一个中等参数模型,远小于R1和o1的大几千亿参数模型。通过特定任务上的监督微调,模型性能得到了优化,但仍与DeepSeek R1和OpenAI o1存在差距。
论文主要探讨了如何实现测试时缩放和增强推理性能的最简方法。研究构建了s1K数据集,通过质量、难度和多样性筛选,最终得到1000个样本。实验结果显示,使用预算强制方法的s1-32B模型在AIME24上超过o1-preview达27%,接近Gemini 2.0的性能。
国内网络环境浮躁,这种未经确认的信息容易误导大众。希望大家遇到此类信息时多加思考。
原文链接
本文链接:https://kx.umi6.com/article/12749.html
转载请注明文章出处
相关推荐
换一换
英伟达:DeepSeek R1现正式上线英伟达NIM平台
2025-01-31 08:48:42
支付宝百宝箱接入 DeepSeek R1 满血版,可免费不限额构建智能体
2025-02-10 15:14:04
腾讯元宝接入 DeepSeek R1 模型,支持深度思考 + 联网搜索
2025-02-13 15:07:39
理想同学 App 接入 DeepSeek R1 满血版
2025-02-19 18:53:41
李飞飞团队再造黑科技!机器人自学家务样样精通,开源代码了解一下?
2024-09-06 19:28:41
“李飞飞团队50美元炼出DeepSeek R1”,如何被曲解了?
2025-02-07 16:04:56
美团开源首发 INT8 无损满血版 DeepSeek R1,部署 A100 实现 50% 吞吐提升
2025-03-07 19:05:33
DeepSeek R1遇难题142次”I give up”,研究还称需增加推理时机控制机制
2025-02-14 13:35:29
DeepSeek使用技巧,你收藏这一篇就够了
2025-02-07 21:09:11
百度 AI 搜索宣布全面接入 DeepSeek R1 最新版,推理能力更强
2025-05-31 16:07:25
Gitee AI 联合沐曦首发全套 DeepSeek R1 千问蒸馏模型,全免费体验
2025-02-03 17:13:53
兆芯全系列整机形态成功部署 DeepSeek R1 大模型
2025-02-24 20:31:53
硅基流动上线 DeepSeek R1 & V3 企业级服务
2025-02-10 21:21:28
633 文章
423857 浏览
24小时热文
更多
-
2026-01-24 00:23:19 -
2026-01-23 22:19:57 -
2026-01-23 22:18:50