标题:LeCun团队推出世界模型二代:62小时搞定机器人训练,开启物理推理新时代
闻乐 发自 凹非寺
量子位 | 公众号 QbitAI
物理学正迈向人工智能领域,Meta开源发布了V-JEPA 2世界模型。这款由图灵奖得主Yann LeCun主导研发的AI模型,能够像人类一样理解物理世界。
世界模型的核心能力包括理解、预测和规划。V-JEPA 2(Meta Video Joint Embedding Predictive Architecture 2)是首个基于视频训练的世界模型,利用互联网上的视频和图像数据进行预训练,无需语言监督,展现了纯视觉自监督学习的强大潜力。
在训练过程中,V-JEPA 2分为两阶段:无动作预训练和动作条件训练。最终,该模型在多个任务中表现出色,如在行为预测任务中达到当前最佳水平,同时在视频问答任务中也展示出领先性能。
针对机器人操作,V-JEPA 2可通过编码器和预测器生成规划控制模型,仅需62小时训练即可实现高效规划。无论是短时间任务还是长时间任务,该模型都能通过视觉子目标指导机器人完成操作,成功率可达65%-80%。
此外,Meta推出了三个新基准测试(IntPhys 2、MVPBench、CausalVQA),用于评估模型的物理理解能力。尽管人类在这些任务中表现优异,但当前模型仍需进一步优化以缩小与人类表现的差距。
未来,Meta计划开发分层次和多模态的JEPA模型,以支持跨时间尺度的规划及多感官预测能力。项目代码已公开于GitHub和Hugging Face平台。
— 完 —
原文链接
本文链接:https://kx.umi6.com/article/20146.html
转载请注明文章出处
相关推荐
换一换
LeCun离职后不止创一份业!押注与大模型不同的路线,加入硅谷初创董事会
2026-01-30 16:36:43
Meta推出世界模型V-JEPA 2 杨立昆参与开发
2025-06-12 14:36:04
Runway 发布 GWM-1 世界模型:未来电影有望靠 AI“算”出来
2025-12-12 15:56:34
捅破具身智能天花板!极佳视界新VLA大模型登场,复杂长时程任务近100%成功率
2026-02-15 14:23:25
Meta内部混乱持续:FAIR自由不再,LeCun考虑辞职
2025-10-03 13:40:34
李飞飞团队发布世界模型最新成果
2025-10-17 10:13:38
李飞飞发布全新世界模型,单GPU就能跑!
2025-10-17 13:16:03
深度解析谷歌Genie 3:“一句话,创造一个世界”
2025-08-18 17:50:45
清华数学系大神跳槽OpenAI!曾主导SAM与Llama开发,Sora负责人:欢迎加入
2026-02-25 13:18:07
李飞飞最新长文火爆硅谷
2025-11-14 17:04:51
李飞飞发布世界模型新成果:一个提示,生成无限3D世界
2025-09-17 10:25:51
李飞飞:空间智能是AI下一个前沿
2025-11-11 14:10:18
小扎砸9位数挖AI 大神、杨立昆发布世界模型,被群嘲的开源旧王要反击了
2025-06-12 15:36:40
692 文章
549339 浏览
24小时热文
更多
-
2026-04-24 20:31:56 -
2026-04-24 20:29:51 -
2026-04-24 19:29:38