
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
Google DeepMind近日推出全新机器人控制模型Gemini Robotics On-Device,该模型可在机器人本地运行,具备视觉识别、语言理解和动作执行能力,即使断网也能独立完成任务。该模型基于Vision-Language-Action(VLA)架构,能理解人类指令并执行复杂操作,如拉开背包拉链、叠衣等。其优势在于低延迟和高稳定性,适用于医疗、救援和工业场景。开发者仅需提供50至100次人工演示即可训练模型,并可适配多种机器人平台。目前,该模型已向部分开发者开放试用,未来有望加速机器人技术普及。
原文链接
加载更多

暂无内容