标题:3B参数模型打通机器人任督二脉,冲咖啡叠衣服样样行,OpenAI也投资
正文: 只需一个3B参数的大模型,就能控制机器人完成各种家务,如叠衣服、冲咖啡等,且无需遥控。
这个通用型机器人控制模型名为π0,由初创公司Physical Intelligence(简称π)开发。该公司创立不久即获得7000万美元的A轮融资,投资者中还包括OpenAI。π0的成功证明了其作为通用机器人控制模型的能力,参数量仅为3B,算力需求低,廉价显卡即可驱动。
网友评价,π0控制的机器人是最接近真正通用机器人的。π0不仅能控制多种机器人,还具有出色的零样本泛化能力、语言控制响应及新任务学习能力。
π团队展示了π0在叠衣服、整理桌面、装鸡蛋等复杂任务中的表现。机器人能够精准建模并控制复杂的接触动力学,如衣物的变形塑性、纸箱的刚性、鸡蛋的脆弱性等。π0甚至能利用工具完成任务,如用叉子装食物。
π0在多个维度上表现出色,零样本泛化能力优于基准模型,指令处理能力强,新任务学习效果佳。在复杂任务中,π0能完成折衣服、整理餐桌、装鸡蛋等任务,平均得分超过50%。
π0基于视觉模型PaLM-ViT改造而成,采用条件流匹配方法建模连续动作分布,训练数据集庞大,涵盖多种任务。
Physical Intelligence公司专注于训练通用机器人模型,不生产硬件。公司创始团队阵容豪华,包括谷歌大脑机器人操作研究主管卡罗尔·豪斯曼和UC伯克利电气工程和计算机科学系副教授谢尔盖·莱文等。
技术报告:https://www.physicalintelligence.company/download/pi0.pdf 参考链接:[1] https://www.physicalintelligence.company/blog/pi0 [2] https://www.reddit.com/r/singularity/comments/1ggm6za/a_3b_pretrained_generalist_model_trained_on_8/ [3] https://twitter.com/chelseabfinn/status/1852043351366996449
-
2025-10-26 00:45:16 -
2025-10-25 23:44:04 -
2025-10-25 22:43:52