标题:AI版《黑客帝国》:无限生成逼真视频,3A画质,还能实时交互
人类离电影《黑客帝国》的场景又近了一步。最近,首个AI基础世界模拟器——The Matrix问世。它能生成无限长、高保真720p真实场景视频,并且支持实时交互。
The Matrix可以生成长达1小时的视频,用户可以通过W(前)、S(后)、A(左)和D(右)键进行实时控制,每秒16帧,帧帧可控。该模拟器由全华人团队打造,成员来自阿里巴巴、香港大学、滑铁卢大学和加拿大AI研究机构Vector Institute。
The Matrix训练数据包括3A游戏的监督数据和大量现实世界场景的无监督视频。不同于以往研究,The Matrix能在零样本情况下理解并预测不同环境中物体的行为和交互。例如,在未见过的办公环境中驾驶宝马X3,或是在水中游泳的车辆。
The Matrix的核心由三大模块组成:交互模块、移窗去噪过程模型(Swin-DPM)和流一致性模型(SCM)。交互模块用于理解用户输入并整合到视频生成中;Swin-DPM通过滑动时间窗口处理长时间依赖关系,实现无限长视频的生成;SCM则加快推理速度,实现实时生成。
此外,研究人员还开发了一个名为GameData的平台,用于自动捕获游戏中的状态数据和视频帧,并生成标注的动作帧数据集。该数据集结合真实世界视频数据,帮助模型学习具体动作控制并增强视觉质量和域泛化能力。
项目负责人是滑铁卢大学助理教授Hongyang Zhang和阿里巴巴研究员Ruili Feng。The Matrix已在GitHub上开源,供更多人探索和应用。
原文链接
本文链接:https://kx.umi6.com/article/9061.html
转载请注明文章出处
相关推荐
换一换
原材料涨价 AI拉动 PCB高景气有望延续至四季度
2025-08-20 08:10:21
AI的尽头是电力?
2025-10-27 17:08:04
微软 AI 部门 CEO 苏莱曼:我们要开发出能让家长放心给孩子用的 AI
2025-10-24 14:40:25
AI讲不了脱口秀:幽默是人类最后的领地吗?
2025-09-18 07:45:37
谷歌前高管加瓦特:AI将消灭中产阶级
2025-08-05 09:12:37
错信AI幻觉,一男子用溴化钠替代食用盐,真给自己吃出幻觉了
2025-08-11 16:05:35
炒安卓冷饭,AI跳票,苹果一夜跌去500亿美元
2025-09-10 16:39:54
黄仁勋:最好的赚钱机会来了!AI五年内创造的百万富翁会比互联网20年创造的更多
2025-07-29 18:35:47
少赚几十亿广告费 百度真和AI拼了
2025-08-22 07:41:23
中国移动:到2028年底 建成国内规模最大智算基础设施
2025-10-12 12:46:25
数字员工崛起:你的未来同事,可能是AI
2025-10-15 16:39:25
腾讯VS网易,从拼游戏到拼AI
2025-08-14 21:02:49
AI唱主角!特斯拉发布“宏图4.0” 马斯克:未来80%价值来自机器人
2025-09-02 14:34:19
581 文章
298458 浏览
24小时热文
更多
-
2025-10-28 18:01:27 -
2025-10-28 18:00:23 -
2025-10-28 17:58:16