斯坦福大学和华盛顿大学的研究人员以不足50美元的云计算费用,训练出名为s1的人工智能推理模型,表现与OpenAI的O1和DeepSeek的R1相当。然而,该模型并非从零开始,而是基于阿里云通义千问模型进行微调。青年AI科学家谢伟迪表示,s1模型的1000个样本训练更像是“锦上添花”。这种低成本训练依赖于强大的基座模型,且1000个样本在大多数情况下不足以训练出复杂的模型。此外,该方法引发了对AI模型知识产权和伦理问题的讨论。尽管存在争议,这一研究为AI领域提供了新的思考方向。
原文链接
本文链接:https://kx.umi6.com/article/12773.html
转载请注明文章出处
相关推荐
换一换
爱彼迎 CEO 布莱恩・切斯基“力挺”阿里通义千问:速度快、效率高、成本低
2025-10-23 12:03:18
雷鸟创新首款AI拍摄眼镜V3将搭载通义千问大模型
2025-01-03 14:50:03
李飞飞再出手,空间智能的ImageNet来了
2026-05-22 16:51:47
吴泳铭:阿里正在建设超大规模AI基础设施
2025-11-07 11:50:19
参数超万亿:阿里发布通义千问最强 AI 大模型 Qwen3-Max 正式版,性能全面领先
2025-09-24 11:36:59
阿里云通义千问 Github 页面 404,负责人回应称没有跑路、突然被官方标记
2024-09-05 13:46:34
李飞飞:公共部门资助,对创新生态至关重要
2025-03-15 21:15:02
李飞飞最新长文火爆硅谷
2025-11-11 11:01:00
阿里通义千问 Qwen3-4B-2507 双料更新:手机也能轻松跑,AI 体积小、性能强
2025-08-07 07:43:52
英伟达 CEO 黄仁勋:中国的 Deepseek 和阿里通义千问是当前最佳开源模型
2025-05-30 21:55:28
李飞飞发布全新世界模型,单GPU就能跑!
2025-10-17 13:16:03
阿里通义千问推出全新推理模型 Qwen3-30B-A3B-Thinking-2507,多项能力显著提升
2025-07-31 07:59:58
阿里通义千问开源 Qwen2.5 大模型,号称性能超越 Llama
2024-09-19 16:44:22
721 文章
718006 浏览
24小时热文
更多
-
2026-06-10 01:48:40 -
2026-06-09 22:40:10 -
2026-06-09 19:38:23