标题:LeCun团队推出世界模型二代:62小时搞定机器人训练,开启物理推理新时代
闻乐 发自 凹非寺
量子位 | 公众号 QbitAI
物理学正迈向人工智能领域,Meta开源发布了V-JEPA 2世界模型。这款由图灵奖得主Yann LeCun主导研发的AI模型,能够像人类一样理解物理世界。
世界模型的核心能力包括理解、预测和规划。V-JEPA 2(Meta Video Joint Embedding Predictive Architecture 2)是首个基于视频训练的世界模型,利用互联网上的视频和图像数据进行预训练,无需语言监督,展现了纯视觉自监督学习的强大潜力。
在训练过程中,V-JEPA 2分为两阶段:无动作预训练和动作条件训练。最终,该模型在多个任务中表现出色,如在行为预测任务中达到当前最佳水平,同时在视频问答任务中也展示出领先性能。
针对机器人操作,V-JEPA 2可通过编码器和预测器生成规划控制模型,仅需62小时训练即可实现高效规划。无论是短时间任务还是长时间任务,该模型都能通过视觉子目标指导机器人完成操作,成功率可达65%-80%。
此外,Meta推出了三个新基准测试(IntPhys 2、MVPBench、CausalVQA),用于评估模型的物理理解能力。尽管人类在这些任务中表现优异,但当前模型仍需进一步优化以缩小与人类表现的差距。
未来,Meta计划开发分层次和多模态的JEPA模型,以支持跨时间尺度的规划及多感官预测能力。项目代码已公开于GitHub和Hugging Face平台。
— 完 —
原文链接
本文链接:https://kx.umi6.com/article/20146.html
转载请注明文章出处
相关推荐
.png)
换一换
LeCun世界模型出2代了!62小时搞定机器人训练,开启物理推理新时代
2025-06-12 17:38:26
世界模型,将是AI的下一个主要形式
2025-03-27 15:57:49
Sora核心作者掌舵,谷歌世界模型新团队全球招募:百万底薪起步
2025-01-07 12:00:27
Runway和Luma又打起来了,Yann LeCun炮轰:你们再牛,也不是「世界模型」
2024-07-01 20:08:32
GPT-4不是世界模型,LeCun双手赞同,ACL力证LLM永远无法模拟世界
2024-06-17 09:33:33
LeCun发布最新世界模型:首次实现16秒连贯场景预测,具身智能掌握第一视角!还打脸用了VAE
2025-06-30 16:43:47
世界模型又近了?MIT惊人研究:LLM已模拟现实世界,绝非随机鹦鹉!
2024-08-19 12:33:58
深度解析谷歌Genie 3:“一句话,创造一个世界”
2025-08-18 17:50:45
图灵奖得主LeCun:人类智能不是通用智能,下一代AI可能基于非生成式
2025-04-14 17:43:19
李飞飞最新访谈:没有空间智能,AGI就不完整
2025-07-03 15:26:49
小扎砸9位数挖AI 大神、杨立昆发布世界模型,被群嘲的开源旧王要反击了
2025-06-12 15:36:40
刚刚!谷歌内部揭秘Genie 3:Sora后最强AI爆款,开启世界模型新时代
2025-08-18 16:52:32
Midjourney发布视频模型:不卷分辨率,但网友直呼画面惊艳
2025-06-19 15:51:06
508 文章
168647 浏览
24小时热文
更多

-
2025-09-06 22:39:24
-
2025-09-06 21:38:26
-
2025-09-06 20:38:03