
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
2025年6月26日,谷歌推出名为Gemini Robotics On-Device的视觉-语言-动作(VLA)模型,这是其首个可微调的VLA模型,专为双臂机器人设计。该模型可在设备本地离线运行,无需依赖网络,适用于对延迟敏感的场景。它具备强大的任务泛化能力,能理解自然语言指令并完成高灵巧度操作,如拉拉链、折叠衣物等。模型支持快速适应新任务,仅需50-100个样本即可展现良好性能,并已适配Franka FR3双臂机器人和Apollo人形机器人,展现了广泛的应用潜力。
原文链接
元戎启行与火山引擎达成深度合作,将在AI汽车领域共同发力。火山引擎作为字节跳动旗下的云与AI服务平台,将为元戎启行提供算力支持,并在AI原生服务、智能驾驶与大语言模型融合等方面展开协同。
元戎启行CEO周光指出,算力、数据与算法是推动VLA(Vision-Language-Action)模型发展的三...
原文链接
标题:AI搞定所有家务?换个房子也能行
近年来,机器人在灵活性和复杂任务处理上取得显著进展,但泛化能力仍是最大挑战。泛化指机器人在新环境中正确完成任务的能力,比如在家里的不同布局中抓起新勺子、理解任务语义并执行相应操作。现有机器人多基于特定场景和相似数据训练,难以适应多样化环境。
美国Physi...
原文链接
标题:智能驾驶水面之下,“AI推理之争”暗流涌动
文 | 极智GeeTech
智能驾驶的竞争正从快速预训练转向深度推理。算力集群与算法架构成为竞争焦点,推理能力成为突破智能瓶颈的关键。“推理”要求AI理解逻辑并生成合理输出,从数据处理到模式识别再到复杂问题解决,这标志着AI的“顿悟”时刻来临...
原文链接
3月30日,在百人会智能汽车创新技术与产业论坛上,元戎启行CEO周光透露已完成VLA模型的道路测试,并计划推出全系列智能驾驶系统产品,兼容激光雷达和纯视觉方案,适配多种芯片平台。预计今年将有超5款搭载VLA模型的车型上市。2024年,元戎启行通过引入大语言模型升级端到端模型为VLA模型,大幅提升智能驾驶系统的全局观与复杂场景应对能力,实现决策透明且全程可追溯。VLA模型被视为迈向完全自动驾驶的关键路径,其卓越性能已在潮汐车道等复杂场景中得到验证。周光指出,VLA模型将推动用户体验从“有无”向“极致体验”转变,预计将在智能驾驶市场爆发期重塑行业格局。
原文链接
加载更多

暂无内容