《科创板日报》报道,斯坦福大学和华盛顿大学研究人员利用不到50美元的云计算费,训练出名为s1的人工智能推理模型。该模型在数学和编码测试中表现优异,接近OpenAI的O1和DeepSeek的R1。经《科创板日报》记者调查,s1并非全新训练,而是基于阿里通义千问(Qwen)模型进行微调。具体而言,仅使用了1000个样本对千问模型进行调整,从而实现这一成果。(记者毛明江 黄心怡)
原文链接
本文链接:https://kx.umi6.com/article/12746.html
转载请注明文章出处
相关推荐
.png)
换一换
李飞飞带队,World Labs估值70亿
2024-07-20 17:14:18
“AI 教母”李飞飞为新公司融资 2.3 亿美元,创业方向瞄准“空间智能”
2024-09-15 15:00:20
李飞飞:公共部门资助,对创新生态至关重要
2025-03-15 21:15:02
创业3个月估值超70亿,李飞飞AI新公司为何能成为最快独角兽?
2024-07-30 00:31:52
李飞飞创业,芯片三巨头投了
2024-09-15 17:52:31
黄仁勋,投了李飞飞:World Labs融资16亿
2024-09-16 03:19:22
李飞飞创业融资16亿,团队首次官宣:1/3华人面孔
2024-09-15 23:26:28
NeurIPS神仙打架:李飞飞180页PPT谈视觉智能,Bengio同OpenAI员工吵架,何恺明谈AI宿命论
2024-12-13 13:23:46
DeepSeek的挑战来了!AI教母李飞飞用不到50美元训练出新模型
2025-02-07 10:51:30
DeepSeek满血微调秘籍开源!站在巨人肩膀打造私有模型,教程在此
2025-02-19 11:45:23
李飞飞创业融资16亿!团队首次官宣:1/3华人面孔,老黄和“乔布斯”都投了
2024-09-15 20:03:58
“AI教母”李飞飞:世界是三维的,我们需要尊重这一事实
2024-12-13 12:21:08
李飞飞空间智能独角兽开源底层技术!AI生成3D世界在所有设备流畅运行
2025-06-03 14:56:07
464 文章
174434 浏览
24小时热文
更多

-
2025-09-08 14:00:34
-
2025-09-08 13:59:39
-
2025-09-08 13:58:15