1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:LeCun团队推出世界模型二代:62小时搞定机器人训练,开启物理推理新时代

闻乐 发自 凹非寺
量子位 | 公众号 QbitAI

物理学正迈向人工智能领域,Meta开源发布了V-JEPA 2世界模型。这款由图灵奖得主Yann LeCun主导研发的AI模型,能够像人类一样理解物理世界。

世界模型的核心能力包括理解、预测和规划。V-JEPA 2(Meta Video Joint Embedding Predictive Architecture 2)是首个基于视频训练的世界模型,利用互联网上的视频和图像数据进行预训练,无需语言监督,展现了纯视觉自监督学习的强大潜力。

在训练过程中,V-JEPA 2分为两阶段:无动作预训练和动作条件训练。最终,该模型在多个任务中表现出色,如在行为预测任务中达到当前最佳水平,同时在视频问答任务中也展示出领先性能。

针对机器人操作,V-JEPA 2可通过编码器和预测器生成规划控制模型,仅需62小时训练即可实现高效规划。无论是短时间任务还是长时间任务,该模型都能通过视觉子目标指导机器人完成操作,成功率可达65%-80%。

此外,Meta推出了三个新基准测试(IntPhys 2、MVPBench、CausalVQA),用于评估模型的物理理解能力。尽管人类在这些任务中表现优异,但当前模型仍需进一步优化以缩小与人类表现的差距。

未来,Meta计划开发分层次和多模态的JEPA模型,以支持跨时间尺度的规划及多感官预测能力。项目代码已公开于GitHub和Hugging Face平台。

— 完 —

原文链接
本文链接:https://kx.umi6.com/article/20146.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
世界模型和具身大脑最新突破:90%生成数据,VLA性能暴涨300%|开源
2025-12-02 14:17:17
恐替代你的岗位:谷歌迈步通用人工智能,AI 世界模型 Genie 3 登场
2025-08-06 08:25:25
万字长文实录:RL 界与 CV 界的“世界模型”有什么不同?丨GAIR Live
2025-09-08 18:05:56
谷歌推出Genie3:世界模型的ChatGPT时刻?
2025-08-06 20:37:25
Meta AI大裁600人
2025-10-23 10:02:20
图灵奖得主LeCun:人类智能不是通用智能,下一代AI可能基于非生成式
2025-04-14 17:43:19
LeCun发布最新世界模型:首次实现16秒连贯场景预测,具身智能掌握第一视角!还打脸用了VAE
2025-06-30 16:43:47
李飞飞最新思考:语言模型救不了机器人
2025-11-18 12:17:48
LeCun:对人工智能末日的担忧被夸大了,Meta正在构建超级智能助手
2024-12-30 21:28:36
华为投资物理 AI:首家国产世界模型公司“极佳视界”完成新一轮亿元级 A1 轮融资
2025-11-12 13:01:59
为什么Sora不能成为世界模型?
2025-03-05 17:16:40
挖走英伟达两员大将:马斯克 xAI 正开发“可用于游戏与机器人领域的世界模型”
2025-10-12 19:46:52
谷歌 DeepMind CEO 哈萨比斯:世界模型是未来,AI 泡沫真实存在
2025-11-20 16:33:14
24小时热文
更多
扫一扫体验小程序