阿里云确认,李飞飞团队的s1模型基于Qwen2.5-32B-Instruct模型训练。该模型在数学和编码能力测试中表现优异,与OpenAI的o1和DeepSeek的R1模型相当。李飞飞团队仅花费不到50美元的云计算费用,在16块H100 GPU上监督微调26分钟完成训练。他们利用蒸馏技术和监督微调方法,使用一个包含1000个精心策划问题的数据集进行训练,该数据集还包含了谷歌Gemini 2.0提供的答案及其思考过程。此模型在竞赛数学问题上的表现比o1-preview高出27%。
原文链接
本文链接:https://kx.umi6.com/article/12747.html
转载请注明文章出处
相关推荐
换一换
李飞飞团队再造黑科技!机器人自学家务样样精通,开源代码了解一下?
2024-09-06 19:28:41
阿里云确认:李飞飞团队 s1 模型基于 Qwen2.5-32B-Instruct 模型训练
2025-02-06 22:40:21
“李飞飞团队50美元炼出DeepSeek R1”,如何被曲解了?
2025-02-07 16:04:56
李飞飞团队50美元训练出DeepSeek R1?
2025-02-06 22:42:33
OpenAI 宣布 ChatGPT 新功能上线:让 AI 理解并使用公司内部“知识”,新增跨平台信息整合与安全控制功能
2025-10-24 21:54:02
友情明码标价,他们花钱「租网友聊天」
2025-10-25 08:14:19
OpenAI 提供英国本地数据存储选项,英司法部雇员导入 ChatGPT
2025-10-24 18:47:26
ChatGPT 涉嫌“诱导”美国 16 岁少年自杀,家属指控 OpenAI 事发前放松安全措施
2025-10-24 15:41:04
快手进军“AI 编程”赛道,推出“工具 + 模型 + 平台”产品矩阵
2025-10-23 16:09:13
斯坦福、哈佛等最新研究:AI 聊天机器人比人类更善于“奉承”
2025-10-25 10:17:38
第三届中国航空运输协会航空大会开幕 近百项人工智能科技及产品亮相
2025-10-25 16:32:54
我国拟修改网络安全法促进人工智能健康发展
2025-10-24 18:49:31
AMD 确认 Radeon AI PRO R9700 32GB 显卡 10 月 27 日零售上市,1299 美元起
2025-10-24 08:28:19
579 文章
294409 浏览
24小时热文
更多
-
2025-10-25 23:44:04 -
2025-10-25 22:43:52 -
2025-10-25 18:38:20