斯坦福大学和华盛顿大学的研究人员以不足50美元的云计算费用,训练出名为s1的人工智能推理模型,表现与OpenAI的O1和DeepSeek的R1相当。然而,该模型并非从零开始,而是基于阿里云通义千问模型进行微调。青年AI科学家谢伟迪表示,s1模型的1000个样本训练更像是“锦上添花”。这种低成本训练依赖于强大的基座模型,且1000个样本在大多数情况下不足以训练出复杂的模型。此外,该方法引发了对AI模型知识产权和伦理问题的讨论。尽管存在争议,这一研究为AI领域提供了新的思考方向。
原文链接
本文链接:https://kx.umi6.com/article/12773.html
转载请注明文章出处
相关推荐
.png)
换一换
英伟达 CEO 黄仁勋:中国的 Deepseek 和阿里通义千问是当前最佳开源模型
2025-05-30 21:55:28
李飞飞空间智能独角兽开源底层技术!AI生成3D世界在所有设备流畅运行
2025-06-03 14:56:07
中国出生的她,3个月做出一家独角兽,估值已超10亿美元,33岁成为斯坦福终身教授,曾为白宫提建议
2024-07-18 18:27:25
阿里云叶杰平:通义千问全球下载量突破4亿
2025-07-27 12:00:44
阿里云通义千问 Qwen2-VL 第二代视觉语言模型开源
2024-09-02 15:36:56
Manus 北京办公区被曝仅剩十余员工在岗,且明确“不再招聘”
2025-07-11 21:45:01
李飞飞团队“50美元”复现DeepSeek R1真相:基座为阿里云Qwen模型
2025-02-06 20:39:58
通义千问 Qwen Chat Memory 上线,AI 能“记住”你指定的重要信息
2025-10-16 15:56:53
李飞飞团队“50美元”复现DeepSeek R1真相:基座曝光
2025-02-07 09:55:00
李飞飞:公共部门资助,对创新生态至关重要
2025-03-15 21:15:02
创业3个月估值超70亿,李飞飞AI新公司为何能成为最快独角兽?
2024-07-30 00:31:52
阿里通义千问 Qwen3-4B-2507 双料更新:手机也能轻松跑,AI 体积小、性能强
2025-08-07 07:43:52
参数超万亿:阿里发布通义千问最强 AI 大模型 Qwen3-Max 正式版,性能全面领先
2025-09-24 11:36:59
522 文章
278693 浏览
24小时热文
更多

-
2025-10-24 01:20:07
-
2025-10-24 00:18:56
-
2025-10-23 21:15:29