1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
独家|李飞飞团队“50美元”复刻DeepSeek的R1真相:基于阿里云Qwen模型监督微调而成
《科创板日报》报道,斯坦福大学和华盛顿大学研究人员利用不到50美元的云计算费,训练出名为s1的人工智能推理模型。该模型在数学和编码测试中表现优异,接近OpenAI的O1和DeepSeek的R1。经《科创板日报》记者调查,s1并非全新训练,而是基于阿里通义千问(Qwen)模型进行微调。具体而言,仅使用了1000个样本对千问模型进行调整,从而实现这一成果。(记者毛明江 黄心怡)
Oasis
02-06 20:43:09
微调
李飞飞
阿里云Qwen
分享至
打开微信扫一扫
内容投诉
生成图片
李飞飞团队“50美元”复现DeepSeek R1真相:基座为阿里云Qwen模型
斯坦福大学和华盛顿大学的研究人员以不足50美元的云计算费用,利用阿里云通义千问(Qwen)模型进行微调,训练出了名为s1的人工智能推理模型。该模型在数学和编码能力测试中表现出色,与OpenAI的O1和DeepSeek的R1模型相当。青年AI科学家谢伟迪指出,s1模型的训练仅使用了1000个样本数据,更像是对已有强大能力的通义千问模型进行微调。尽管这种低成本训练展示了AI训练的潜力,但也引发了对AI模型知识产权和伦理问题的讨论。未来,降低成本同时保持高性能仍是AI研究的重要课题。
阿达旻
02-06 20:39:58
低成本训练
李飞飞
阿里云Qwen
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序