
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
斯坦福大学和华盛顿大学的研究人员以不足50美元的云计算费用,训练出名为s1的人工智能推理模型,表现与OpenAI的O1和DeepSeek的R1相当。然而,该模型并非从零开始,而是基于阿里云通义千问模型进行微调。青年AI科学家谢伟迪表示,s1模型的1000个样本训练更像是“锦上添花”。这种低成本训练依赖于强大的基座模型,且1000个样本在大多数情况下不足以训练出复杂的模型。此外,该方法引发了对AI模型知识产权和伦理问题的讨论。尽管存在争议,这一研究为AI领域提供了新的思考方向。
原文链接
斯坦福大学和华盛顿大学的研究人员以不足50美元的云计算费用,利用阿里云通义千问(Qwen)模型进行微调,训练出了名为s1的人工智能推理模型。该模型在数学和编码能力测试中表现出色,与OpenAI的O1和DeepSeek的R1模型相当。青年AI科学家谢伟迪指出,s1模型的训练仅使用了1000个样本数据,更像是对已有强大能力的通义千问模型进行微调。尽管这种低成本训练展示了AI训练的潜力,但也引发了对AI模型知识产权和伦理问题的讨论。未来,降低成本同时保持高性能仍是AI研究的重要课题。
原文链接
加载更多

暂无内容