
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
近日,李飞飞团队与斯坦福大学及华盛顿大学的研究人员以不到50美元的云计算费用训练出了名为s1的人工智能推理模型,其表现与OpenAI O1和DeepSeek R1等顶级模型相当。然而,这是否意味着我们已达到这种水平?
s1模型的核心在于s1K数据集和预算强制法。s1K数据集包含1000个精选问题,涵...
原文链接
标题:李飞飞团队50美元训练出DeepSeek R1?
今天下午,一条新闻刷屏了:“震惊”“李飞飞”“50美元”“Deep Seek R1”。这消息似乎对OpenAI和英伟达构成了冲击。然而,事实并非如此。
首先,这50美元是怎么来的?论文提到使用了16块H100 GPU,耗时26分钟,如果租用服务...
原文链接
阿里云确认,李飞飞团队的s1模型基于Qwen2.5-32B-Instruct模型训练。该模型在数学和编码能力测试中表现优异,与OpenAI的o1和DeepSeek的R1模型相当。李飞飞团队仅花费不到50美元的云计算费用,在16块H100 GPU上监督微调26分钟完成训练。他们利用蒸馏技术和监督微调方法,使用一个包含1000个精心策划问题的数据集进行训练,该数据集还包含了谷歌Gemini 2.0提供的答案及其思考过程。此模型在竞赛数学问题上的表现比o1-preview高出27%。
原文链接
李飞飞团队研发出突破性的黑科技,让家务机器人能熟练完成倒茶、叠衣服、整理书籍、丢垃圾等家务活。这一创新背后是团队独创的“关系关键点约束”(ReKep)技术。
ReKep 技术将任务分解为关键点,并通过规则指导机器人理解关键点之间的联系,实现精准操作。例如,倒茶时,机器人先识别茶壶、茶杯的位置及形状,...
原文链接
加载更多

暂无内容