1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:李飞飞团队50美元训练出DeepSeek R1?

今天下午,一条新闻刷屏了:“震惊”“李飞飞”“50美元”“Deep Seek R1”。这消息似乎对OpenAI和英伟达构成了冲击。然而,事实并非如此。

首先,这50美元是怎么来的?论文提到使用了16块H100 GPU,耗时26分钟,如果租用服务器,成本确实只有几十美元。但论文的核心并不是训练出DeepSeek R1。论文基于开源的Qwen2.5 - 32B模型,这是一个中等参数模型,远小于R1和o1的大几千亿参数模型。通过特定任务上的监督微调,模型性能得到了优化,但仍与DeepSeek R1和OpenAI o1存在差距。

论文主要探讨了如何实现测试时缩放和增强推理性能的最简方法。研究构建了s1K数据集,通过质量、难度和多样性筛选,最终得到1000个样本。实验结果显示,使用预算强制方法的s1-32B模型在AIME24上超过o1-preview达27%,接近Gemini 2.0的性能。

国内网络环境浮躁,这种未经确认的信息容易误导大众。希望大家遇到此类信息时多加思考。

原文链接
本文链接:https://kx.umi6.com/article/12749.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
理想同学 App 接入 DeepSeek R1 满血版
2025-02-19 18:53:41
Gitee AI 联合沐曦首发全套 DeepSeek R1 千问蒸馏模型,全免费体验
2025-02-03 17:13:53
腾讯元宝接入 DeepSeek R1 模型,支持深度思考 + 联网搜索
2025-02-13 15:07:39
李飞飞团队再造黑科技!机器人自学家务样样精通,开源代码了解一下?
2024-09-06 19:28:41
o3-mini碾压DeepSeek R1?一条python程序引发近400万围观
2025-02-03 09:05:18
DeepSeek R1遇难题142次”I give up”,研究还称需增加推理时机控制机制
2025-02-14 13:35:29
阿里云确认:李飞飞团队 s1 模型基于 Qwen2.5-32B-Instruct 模型训练
2025-02-06 22:40:21
高通 CEO 安蒙称 DeepSeek R1 模型对高通有利,能直接在本地设备上运行
2025-02-06 17:39:06
“李飞飞团队50美元炼出DeepSeek R1”,如何被曲解了?
2025-02-07 16:04:56
昆仑万维旗下 Opera 接入 DeepSeek R1 模型,支持本地个性化部署
2025-02-19 22:58:07
硅基流动上线 DeepSeek R1 & V3 企业级服务
2025-02-10 21:21:28
美团开源首发 INT8 无损满血版 DeepSeek R1,部署 A100 实现 50% 吞吐提升
2025-03-07 19:05:33
李飞飞团队50美元训练出DeepSeek R1?
2025-02-06 22:42:33
24小时热文
更多
扫一扫体验小程序