1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:对话原力灵机周而进:2.4B模型够用,具身原生是关键

正文:
一个专注于具身智能的公司推出了仅2.4B参数的模型DM0,远低于行业标杆如π 0(33亿参数)和π 0.6(50亿参数)。这家公司认为,2.4B足够支撑实时处理三视角728×728画面,推理延迟仅60毫秒,并通过强化学习在真机上不断进化。

DM0被称为“首个具身原生大模型”,由原力灵机推出,背后操盘手是合伙人周而进。他在AI领域已深耕13年,早在2013年就以实习生身份拿下ICCV自然环境人脸关键点定位比赛冠军。如今,他与昔日旷视同事范浩强、汪天才共同创业,目标是打造具身智能。

主流具身模型多采用VLM+Action Head方案,即大模型负责识别逻辑,动作头负责执行。但周而进认为这是“外挂式”方法,原力灵机追求的是从数据采集到控制结构都源自物理世界的“具身原生”路线。DM0通过多源、多任务训练,将感知、推理、控制整合为闭环,结合空间推理思维链(Spatial CoT),实现具身智能的内生化。

DM0的训练分为三个阶段:
1. VLM Train:从零构建具身原生模型,融合互联网、智驾和具身多传感数据,理解物理环境。
2. VLA Pre-Train:通过多任务、多机型训练和空间推理思维链,让具身能力涌现。
3. VLA Post-Train:针对特定场景适配优化。

此外,团队还发布了开源框架Dexbotic 2.0和量产工作流DFOL,目标是实现操作与导航、模仿学习与强化学习的统一。

周而进强调“全身全时全域”数据采集的重要性,覆盖底盘移动、躯干协调及传感器反馈,确保模型能应对物理世界的无限长尾问题。他认为,精细动作的前提是精细感知,因此高分辨率输入至关重要。

物流场景被选为落地起点,因其标准化程度高、可复制性强,且能快速形成数据闭环。未来,团队计划逐步拓展至ToB场景,最终迈向家庭等ToC领域。

关于世界模型,周而进认为其核心在于预测动作结果,而非直接输出策略。它帮助模型模拟物理反馈,提升泛化能力。

对于终极目标,周而进提出“机器人拥有社会身份”的愿景,例如具备独立支付能力。这需要解决信用体系、责任追溯等问题,使机器人成为社会化接口。

原力灵机团队分工明确:唐文斌负责商业与资源整合,周而进与汪天才主攻基模训练,范浩强专注软硬件协同。他们相信,具身智能的未来在于场景驱动与技术闭环。

DM0技术报告:https://dexmal.com/DM0_Tech_Report.pdf

原文链接
本文链接:https://kx.umi6.com/article/32957.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
对话原力灵机周而进:模型2.4B就够用,关键是“具身原生”;能闭环才是最高效方法
2026-02-13 14:22:41
市场监管总局召开餐饮服务连锁企业行政指导会
2026-02-12 21:47:19
从Seedance 2.0到AI天团!海淀何以“生成”全球爆款——
2026-02-15 20:40:46
AI“烧钱”引担忧!亚马逊“入熊”:创近20年来最长连跌纪录
2026-02-14 16:28:55
智谱冲A新进展:增聘国泰海通为辅导机构 重新办理辅导备案登记
2026-02-13 09:10:31
微软AI CEO:未来18个月大量白领工作将被人工智能取代 这些职位先遭殃
2026-02-14 15:24:19
联想杨元庆:推动AI普及普惠 不是让大家都去用豆包、千问和Kimi
2026-02-12 19:40:20
美国无人机群挑战赛选用OpenAI语音控制技术
2026-02-14 02:55:40
智元机器人公布新专利 可提高机器人控制的精度
2026-02-14 14:21:54
豆包大模型2.0正式发布
2026-02-14 14:23:01
我把Agent拉进群聊,它竟然开始带队干活?全球首个AI社交通用平台来了!
2026-02-14 17:29:25
蚂蚁集团发布Ming-Flash-Omni 2.0,开源全模态大模型性能新标杆
2026-02-13 14:21:14
农业农村部:聚焦生物育种、人工智能、农业机器人等重点领域 加快突破关键核心技术
2026-02-13 21:41:57
24小时热文
更多
扫一扫体验小程序