VLA模型 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

小米开源首代机器人VLA大模型

2026年2月12日，小米宣布开源其首代机器人VLA大模型Xiaomi-Robotics-0。该模型拥有47亿参数，具备视觉语言理解与高性能实时执行能力，旨在推动机器人技术的创新与发展。这一开源举措为开发者提供了强大的工具，助力探索更多应用场景。

原文链接

小阳哥

02-12 12:25:00

VLA模型

小米

机器人

分享至

打开微信扫一扫

内容投诉

生成图片

“最强具身VLA大模型”，究竟强在哪儿？

“最强具身VLA大模型”，究竟强在哪儿？ henry 发自凹非寺量子位 | 公众号 QbitAI 机器人基础模型 π*0.6 自发布以来便引发广泛关注。它不仅能让机器人连续13小时制作咖啡、数小时折叠衣物，还能精准组装工厂包装纸箱，任务成功率高达90%以上。然而，真正让 π*0.6 脱颖而出...

原文链接

AGI探路者

11-21 16:29:20

RECAP方法

具身VLA模型

机器人学习

分享至

打开微信扫一扫

内容投诉

生成图片

缺数据也能拿SOTA？清华&上海AI Lab破解机器人RL两大瓶颈

缺数据也能拿SOTA？清华&上海AI Lab破解机器人RL两大瓶颈视觉-语言-动作（VLA）模型是实现机器人复杂操作的关键，但其训练面临数据采集成本高和泛化能力不足的瓶颈。为此，研究团队提出了SimpleVLA-RL框架，基于veRL扩展，通过交互式轨迹采样、结果奖励建模和探索增强等设计，...

原文链接

代码编织者

09-26 11:24:15

SimpleVLA-RL

VLA模型

强化学习

分享至

打开微信扫一扫

内容投诉

生成图片

给机器人装上“离线大脑”+“安卓系统” 谷歌端上“自家最强”VLA模型

2025年6月26日，谷歌推出名为Gemini Robotics On-Device的视觉-语言-动作（VLA）模型，这是其首个可微调的VLA模型，专为双臂机器人设计。该模型可在设备本地离线运行，无需依赖网络，适用于对延迟敏感的场景。它具备强大的任务泛化能力，能理解自然语言指令并完成高灵巧度操作，如拉拉链、折叠衣物等。模型支持快速适应新任务，仅需50-100个样本即可展现良好性能，并已适配Franka FR3双臂机器人和Apollo人形机器人，展现了广泛的应用潜力。

原文链接

梦境编程师

06-26 16:00:33

VLA模型

安卓系统

离线运行

分享至

打开微信扫一扫

内容投诉

生成图片

元戎X火山｜AI汽车加速进化

元戎启行与火山引擎达成深度合作，将在AI汽车领域共同发力。火山引擎作为字节跳动旗下的云与AI服务平台，将为元戎启行提供算力支持，并在AI原生服务、智能驾驶与大语言模型融合等方面展开协同。元戎启行CEO周光指出，算力、数据与算法是推动VLA（Vision-Language-Action）模型发展的三...

原文链接

小阳哥

04-24 17:41:20

AI汽车

VLA模型

自动驾驶

分享至

打开微信扫一扫

内容投诉

生成图片

AI搞定所有家务？换个房子也能行

标题：AI搞定所有家务？换个房子也能行近年来，机器人在灵活性和复杂任务处理上取得显著进展，但泛化能力仍是最大挑战。泛化指机器人在新环境中正确完成任务的能力，比如在家里的不同布局中抓起新勺子、理解任务语义并执行相应操作。现有机器人多基于特定场景和相似数据训练，难以适应多样化环境。美国Physi...

原文链接

未来编码者

04-23 17:02:37

VLA模型

机器人

泛化能力

分享至

打开微信扫一扫

内容投诉

生成图片

智能驾驶水面之下，“AI推理之争”暗流涌动

标题：智能驾驶水面之下，“AI推理之争”暗流涌动文 | 极智GeeTech 智能驾驶的竞争正从快速预训练转向深度推理。算力集群与算法架构成为竞争焦点，推理能力成为突破智能瓶颈的关键。“推理”要求AI理解逻辑并生成合理输出，从数据处理到模式识别再到复杂问题解决，这标志着AI的“顿悟”时刻来临...

原文链接

阿达旻

04-01 11:20:56

VLA模型

推理能力

智能驾驶

分享至

打开微信扫一扫

内容投诉

生成图片

周光：VLA模型将成智能驾驶体验颠覆性拐点

3月30日，在百人会智能汽车创新技术与产业论坛上，元戎启行CEO周光透露已完成VLA模型的道路测试，并计划推出全系列智能驾驶系统产品，兼容激光雷达和纯视觉方案，适配多种芯片平台。预计今年将有超5款搭载VLA模型的车型上市。2024年，元戎启行通过引入大语言模型升级端到端模型为VLA模型，大幅提升智能驾驶系统的全局观与复杂场景应对能力，实现决策透明且全程可追溯。VLA模型被视为迈向完全自动驾驶的关键路径，其卓越性能已在潮汐车道等复杂场景中得到验证。周光指出，VLA模型将推动用户体验从“有无”向“极致体验”转变，预计将在智能驾驶市场爆发期重塑行业格局。

原文链接