1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

斯坦福大学和华盛顿大学的研究人员以不足50美元的云计算费用,利用阿里云通义千问(Qwen)模型进行微调,训练出了名为s1的人工智能推理模型。该模型在数学和编码能力测试中表现出色,与OpenAI的O1和DeepSeek的R1模型相当。青年AI科学家谢伟迪指出,s1模型的训练仅使用了1000个样本数据,更像是对已有强大能力的通义千问模型进行微调。尽管这种低成本训练展示了AI训练的潜力,但也引发了对AI模型知识产权和伦理问题的讨论。未来,降低成本同时保持高性能仍是AI研究的重要课题。

原文链接
本文链接:https://kx.umi6.com/article/12743.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
李飞飞世界模型大更新,实时生成3D世界,只要一块GPU
2025-10-17 13:16:18
独家|李飞飞团队“50美元”复刻DeepSeek的R1真相:基于阿里云Qwen模型监督微调而成
2025-02-06 20:43:09
李飞飞被曝AI创业!做空间智能,已筹集种子轮融资
2024-05-20 14:39:07
看见的世界,看不见的李飞飞
2024-07-29 22:41:44
李飞飞团队训练出媲美DeepSeek R1的推理模型 云计算费用不到50美元
2025-02-06 16:39:43
李飞飞发布世界模型新成果:一个提示,生成无限3D世界
2025-09-17 10:25:51
李飞飞旗下AI初创企业估值已超10亿美元
2024-07-17 16:16:27
李飞飞团队发布世界模型最新成果
2025-10-17 10:13:38
李飞飞自曝详细创业经历:五年前因眼睛受伤,坚定要做世界模型
2025-06-10 11:44:06
李飞飞最新报告:中美顶级模型性能差距缩至0.3%
2025-04-10 09:46:25
李飞飞,带出一个学生军团
2024-12-06 16:27:59
李飞飞创业:3个月估值破10亿美元
2024-07-17 19:48:49
李飞飞团队“50美元”复现DeepSeek R1真相:基座曝光
2025-02-07 09:55:00
24小时热文
更多
扫一扫体验小程序