无需 3D 模型 / 物理引擎：谷歌 DeepMind 联合开发力提示技术，AI 生成视频可模拟真实运动

2025-06-04 09:16:20

灵感Phoenix

发布在

快讯

阅读：496

6月3日，谷歌DeepMind联合布朗大学开发了一项名为“力提示”的新技术，无需3D模型或物理引擎即可生成逼真运动的AI视频。用户可通过指定力的方向和强度操控生成内容，支持全局力与局部力两种模式。研究基于CogVideoX-5B-I2V模型加入ControlNet模块，利用Transformer架构生成每段含49帧的视频，仅用4台Nvidia A100 GPU训练一天完成。训练数据全为合成，涵盖多种物理场景。尽管数据有限，但模型展现出强大泛化能力，能适应新物体与场景，并初步掌握简单物理规则。测试显示其运动匹配度和真实感优于基准模型，但在复杂场景中仍有不足，如烟雾无视风力等问题。DeepMind CEO Demis Hassabis称，此技术是迈向通用AI的重要一步，未来AI可能通过模拟环境学习而非单纯依赖数据。

原文链接

本文链接：https://kx.umi6.com/article/19664.html

转载请注明文章出处

AI生成视频