1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:谷歌推出“游戏版sora”:Genie 2模糊物理与数字世界界限

近日,谷歌DeepMind发布了最新基础世界模型Genie 2,可通过一张图像或文字描述生成3D场景,增加更复杂的交互功能。用户只需提供一张由Imagen 3生成的图像和文字描述,Genie 2就能生成可交互的3D环境,供用户自由探索。

Genie 2不仅能生成高质量的3D场景,还具备扩展场景的能力,保持生成环境的一致性。它能模拟物体交互、动画、光照、物理反射效果及NPC行为,画质接近3A级游戏。网友认为,Genie 2模糊了物理世界和数字世界的界限,展示了未来如“头号玩家”般的世界模型。

Genie 2的独特之处在于能按需创建高度可定制的游戏。只需简单输入图像作为提示,系统便能创建可玩的世界,适应特定训练或游戏需求。这使研究人员能生成前所未见的任务,帮助AI培养可转移至现实世界的技能。例如,SIMA代理可根据图像提示,执行在新环境中的指令。

Genie 2还具备多项功能,包括智能响应操作、生成不同轨迹、记忆生成内容、保持长时间世界一致性、支持多种风格和复杂3D结构、模拟物理交互及动画制作。它促进一般代理训练,使AI能适应各种挑战,如机器人训练、虚拟助手提升等。

尽管Genie 2仍处于早期阶段,但它已为游戏开发和AI研究带来新机遇。对独立开发者而言,Genie 2能快速创建独特体验,减少设计时间和成本。对玩家而言,未来游戏环境将更动态、个性化和身临其境。

Genie 2的技术也可应用于虚拟现实、模拟和机器人等领域,推动技术革命。例如,机器人可在Genie 2生成的环境中训练,提高导航和互动能力。虚拟助手也能通过这些环境提升任务理解与响应能力。

Genie 2背后的原理是一种自回归潜在扩散模型,通过分析大量视频数据学习生成视频内容。它使用自动编码器提取关键信息,再通过大型transformer动态模型学习帧间关系,采用自回归采样方法逐帧生成视频,确保连贯性和真实感。此外,还引入无分类指导技术增强生成动作的可控性。

Genie 2的出现预示着3D AI技术将推动技术进步,深刻改变我们与世界的互动方式,开启一个智能、互联的新时代。从机器人技术到自动驾驶,从虚拟现实到城市规划,3D AI的应用潜力无限。

原文链接
本文链接:https://kx.umi6.com/article/9929.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
大模型的2024年:我们对AI的发展脱敏了
2024-12-27 10:58:14
马斯克旗下AI游戏工作室首度发文
2025-05-21 17:13:43
谷歌邀马斯克联手做AI游戏!DeepMind版Sora是个3D游戏引擎 profile-avatar
2024-12-05 12:59:26
24小时热文
更多
扫一扫体验小程序