自变量王潜:具身智能是物理世界的独立基础模型|MEET2026
过去一年,具身智能领域争论不断:它是多模态模型的应用,还是全新的基础模型?自变量机器人创始人兼CEO王潜明确表示,具身智能是独立于语言模型和多模态模型的物理世界基础模型。
这一观点源于对物理世界与虚拟世界本质差异的重新认识。虚拟世界以符号为基础,具有高度可复现性和低随机性;而物理世界则充满连续性、随机性和不可观测性,涉及力、接触和时序等复杂过程。现有模型架构和数据能力难以精准刻画这些特性,因此沿用虚拟世界的建模范式存在结构性错位。
自变量机器人选择了一条长期路线:从模型架构、数据范式到硬件形态,系统性地构建“物理世界的智能底座”。王潜指出,物理事件的高度随机性使得现有模型难以应对。例如,用相同方式推同一个杯子,结果可能完全不同。这种复杂性要求我们另起炉灶,设计专门面向物理世界的基础模型。
此外,人类在物理世界中的学习方式与虚拟世界截然不同。比如,识别一只狗并不需要一万张图片,而是通过观察其动态行为和互动获得因果性和时序信息。这种主动感知(Active Perception)是未来多模态模型的重要方向。如果坚持静态学习方式,效率将远低于人类。
展望未来,王潜认为具身智能基础模型可能在未来十年内超越甚至取代现有模型。他强调,统一模型应完全端到端,并需考虑端侧部署和推理速度。自变量已在高自由度灵巧手控制等复杂任务上取得突破,展示了跨本体泛化能力和高效推理速度。
数据方面,现实世界数据是核心来源,训练需分阶段进行,包括预训练、后训练和推理时扩展。这需要全新的学习范式,让AI定义硬件,而非先制造完美硬件再加载AI模型。自变量已推出两款全自研轮式底盘人形机器人和高自由度灵巧手,向市场销售。
最后,王潜呼吁重视具身智能的重要性。他认为,AGI(通用人工智能)的发展离不开物理资源,而具身智能有望实现“机器制造机器”的指数级增长,推动芯片、电力和数据的爆发式进步,从而迈向真正的通用智能未来。
-
2025-12-21 21:06:06 -
2025-12-21 21:04:58 -
2025-12-21 21:01:50