李飞飞团队 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

“李飞飞团队50美元炼出DeepSeek R1”，如何被曲解了？

近日，李飞飞团队与斯坦福大学及华盛顿大学的研究人员以不到50美元的云计算费用训练出了名为s1的人工智能推理模型，其表现与OpenAI O1和DeepSeek R1等顶级模型相当。然而，这是否意味着我们已达到这种水平？ s1模型的核心在于s1K数据集和预算强制法。s1K数据集包含1000个精选问题，涵...

原文链接

数据炼金师

02-07 16:04:56

DeepSeek R1

李飞飞团队

预算强制

分享至

打开微信扫一扫

内容投诉

生成图片

李飞飞团队50美元训练出DeepSeek R1?

标题：李飞飞团队50美元训练出DeepSeek R1? 今天下午，一条新闻刷屏了：“震惊”“李飞飞”“50美元”“Deep Seek R1”。这消息似乎对OpenAI和英伟达构成了冲击。然而，事实并非如此。首先，这50美元是怎么来的？论文提到使用了16块H100 GPU，耗时26分钟，如果租用服务...

原文链接

Nebula

02-06 22:42:33

50美元

DeepSeek R1

李飞飞团队

分享至

打开微信扫一扫

内容投诉

生成图片

阿里云确认：李飞飞团队 s1 模型基于 Qwen2.5-32B-Instruct 模型训练

阿里云确认，李飞飞团队的s1模型基于Qwen2.5-32B-Instruct模型训练。该模型在数学和编码能力测试中表现优异，与OpenAI的o1和DeepSeek的R1模型相当。李飞飞团队仅花费不到50美元的云计算费用，在16块H100 GPU上监督微调26分钟完成训练。他们利用蒸馏技术和监督微调方法，使用一个包含1000个精心策划问题的数据集进行训练，该数据集还包含了谷歌Gemini 2.0提供的答案及其思考过程。此模型在竞赛数学问题上的表现比o1-preview高出27%。

原文链接

新智燎原

02-06 22:40:21

Qwen2.5-32B-Instruct

s1模型

李飞飞团队

分享至

打开微信扫一扫

内容投诉

生成图片

李飞飞团队再造黑科技！机器人自学家务样样精通，开源代码了解一下？

李飞飞团队研发出突破性的黑科技，让家务机器人能熟练完成倒茶、叠衣服、整理书籍、丢垃圾等家务活。这一创新背后是团队独创的“关系关键点约束”（ReKep）技术。 ReKep 技术将任务分解为关键点，并通过规则指导机器人理解关键点之间的联系，实现精准操作。例如，倒茶时，机器人先识别茶壶、茶杯的位置及形状，...

原文链接