1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:李飞飞团队50美元训练出DeepSeek R1?

今天下午,一条新闻刷屏了:“震惊”“李飞飞”“50美元”“Deep Seek R1”。这消息似乎对OpenAI和英伟达构成了冲击。然而,事实并非如此。

首先,这50美元是怎么来的?论文提到使用了16块H100 GPU,耗时26分钟,如果租用服务器,成本确实只有几十美元。但论文的核心并不是训练出DeepSeek R1。论文基于开源的Qwen2.5 - 32B模型,这是一个中等参数模型,远小于R1和o1的大几千亿参数模型。通过特定任务上的监督微调,模型性能得到了优化,但仍与DeepSeek R1和OpenAI o1存在差距。

论文主要探讨了如何实现测试时缩放和增强推理性能的最简方法。研究构建了s1K数据集,通过质量、难度和多样性筛选,最终得到1000个样本。实验结果显示,使用预算强制方法的s1-32B模型在AIME24上超过o1-preview达27%,接近Gemini 2.0的性能。

国内网络环境浮躁,这种未经确认的信息容易误导大众。希望大家遇到此类信息时多加思考。

原文链接
本文链接:https://kx.umi6.com/article/12749.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
Gitee AI 联合沐曦首发全套 DeepSeek R1 千问蒸馏模型,全免费体验
2025-02-03 17:13:53
老显卡福音!美团开源首发INT8无损满血版DeepSeek R1
2025-03-04 21:29:39
非技术人10分钟读懂Deepseek R1
2025-02-14 18:44:39
o3-mini碾压DeepSeek R1?一条python程序引发近400万围观
2025-02-03 09:05:18
支付宝百宝箱接入 DeepSeek R1 满血版,可免费不限额构建智能体
2025-02-10 15:14:04
再加一把火、造福全人类,Hugging Face 号召打造完全开源版 DeepSeek R1 大模型
2025-01-28 22:54:35
DeepSeek R1遇难题142次”I give up”,研究还称需增加推理时机控制机制
2025-02-14 13:35:29
科大讯飞星火 X1 模型升级,数学能力全面对标 DeepSeek R1 和 OpenAI o1
2025-03-03 10:16:41
小米超级小爱重新上线 DeepSeek R1,默认使用联网搜索
2025-02-22 18:41:54
效率革命还是资源黑洞?DeepSeek R1背后的杰文斯悖论探讨
2025-02-15 22:11:06
“李飞飞团队50美元炼出DeepSeek R1”,如何被曲解了?
2025-02-07 16:04:56
DeepSeek使用技巧,你收藏这一篇就够了
2025-02-07 21:09:11
阿里云确认:李飞飞团队 s1 模型基于 Qwen2.5-32B-Instruct 模型训练
2025-02-06 22:40:21
24小时热文
更多
扫一扫体验小程序