近日,Meta深度学习三巨头之一Yann LeCun团队发布名为PEVA的世界模型,首次实现16秒连贯场景预测,让具身智能体掌握第一视角预判能力。该模型通过结构化动作表示与条件扩散Transformer架构,结合全身关节运动学数据与视频帧,实现从动作到第一视角视频的高精度生成。实验表明,PEVA在多项任务中优于基线模型,具备智能规划能力,可完成开冰箱、抓取物体等复杂任务。值得注意的是,尽管LeCun曾批评VAE,但PEVA仍使用其进行图像生成后处理,引发讨论。该突破或将改写具身智能体的反应方式,使其更接近人类预判能力。
原文链接
本文链接:https://kx.umi6.com/article/20960.html
转载请注明文章出处
相关推荐
.png)
换一换
AI要进步,居然得先学打游戏?
2024-12-06 09:17:35
2025十大AI技术趋势:具身智能、世界模型都有望迎来ChatGPT时刻
2025-01-09 11:54:47
Meta推出世界模型V-JEPA 2 杨立昆参与开发
2025-06-12 14:36:04
深度解析谷歌Genie 3:“一句话,创造一个世界”
2025-08-18 17:50:45
LeCun锐评诺奖:出于压力才颁给AI,但两个成果已经完全无用
2024-10-25 15:50:52
“AI空间智能”未来已来,如何翻开人工智能下一章?
2024-12-27 18:09:42
Sora核心作者掌舵,谷歌世界模型新团队全球招募:百万底薪起步
2025-01-07 12:00:27
谷歌发布世界模型Genie 3
2025-08-06 09:28:52
Meta 推出名为 V-JEPA 2 的“世界模型”,助力机器人理解物理世界
2025-06-12 12:33:00
“AI教母”李飞飞揭秘“世界模型”:要让AI像人类一样理解三维空间
2025-06-06 11:29:37
世界模型成AGI关键 算力成本、数据质量成两大桎梏
2025-06-06 14:33:11
LeCun:对人工智能末日的担忧被夸大了,Meta正在构建超级智能助手
2024-12-30 21:28:36
李飞飞的世界模型,大厂在反向操作?
2025-06-06 14:32:06
563 文章
257601 浏览
24小时热文
更多

-
2025-10-23 21:15:29
-
2025-10-23 20:16:19
-
2025-10-23 20:15:12