谷歌，暗搓搓发了一个“游戏版sora”

2024-12-09 19:32:54

谷歌，暗搓搓发了一个“游戏版sora”

AGI探路者

发布在

科普

阅读：762

标题：谷歌推出“游戏版sora”：Genie 2模糊物理与数字世界界限

近日，谷歌DeepMind发布了最新基础世界模型Genie 2，可通过一张图像或文字描述生成3D场景，增加更复杂的交互功能。用户只需提供一张由Imagen 3生成的图像和文字描述，Genie 2就能生成可交互的3D环境，供用户自由探索。

Genie 2不仅能生成高质量的3D场景，还具备扩展场景的能力，保持生成环境的一致性。它能模拟物体交互、动画、光照、物理反射效果及NPC行为，画质接近3A级游戏。网友认为，Genie 2模糊了物理世界和数字世界的界限，展示了未来如“头号玩家”般的世界模型。

Genie 2的独特之处在于能按需创建高度可定制的游戏。只需简单输入图像作为提示，系统便能创建可玩的世界，适应特定训练或游戏需求。这使研究人员能生成前所未见的任务，帮助AI培养可转移至现实世界的技能。例如，SIMA代理可根据图像提示，执行在新环境中的指令。

Genie 2还具备多项功能，包括智能响应操作、生成不同轨迹、记忆生成内容、保持长时间世界一致性、支持多种风格和复杂3D结构、模拟物理交互及动画制作。它促进一般代理训练，使AI能适应各种挑战，如机器人训练、虚拟助手提升等。

尽管Genie 2仍处于早期阶段，但它已为游戏开发和AI研究带来新机遇。对独立开发者而言，Genie 2能快速创建独特体验，减少设计时间和成本。对玩家而言，未来游戏环境将更动态、个性化和身临其境。

Genie 2的技术也可应用于虚拟现实、模拟和机器人等领域，推动技术革命。例如，机器人可在Genie 2生成的环境中训练，提高导航和互动能力。虚拟助手也能通过这些环境提升任务理解与响应能力。

Genie 2背后的原理是一种自回归潜在扩散模型，通过分析大量视频数据学习生成视频内容。它使用自动编码器提取关键信息，再通过大型transformer动态模型学习帧间关系，采用自回归采样方法逐帧生成视频，确保连贯性和真实感。此外，还引入无分类指导技术增强生成动作的可控性。

Genie 2的出现预示着3D AI技术将推动技术进步，深刻改变我们与世界的互动方式，开启一个智能、互联的新时代。从机器人技术到自动驾驶，从虚拟现实到城市规划，3D AI的应用潜力无限。

原文链接

本文链接：https://kx.umi6.com/article/9929.html

转载请注明文章出处

3D世界模型

AI游戏

Genie 2

分享至

打开微信扫一扫

内容投诉

生成图片

AGI探路者

803 文章

845373 浏览

24小时热文