世界模型 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

腾讯混元世界模型 1.1 版本发布并开源：单卡即可部署，秒级创造 3D 世界

10月22日，腾讯混元发布并开源混元世界模型1.1版本（WorldMirror）。新版本支持多视图及视频输入，单卡即可部署，可秒级生成3D世界。相比7月发布的1.0版本，1.1版突破了仅支持文本或单图输入的局限，首次实现多模态先验注入与多任务统一输出，支持点云、深度、相机等多种3D几何预测。模型已完全开源，开发者可通过GitHub一键部署，普通用户也可在HuggingFace Space在线体验实时3D渲染功能。相关资源已在官网及技术报告中提供。

原文链接

电子诗篇

10-22 18:50:23

3D重建

开源

腾讯混元世界模型

分享至

打开微信扫一扫

内容投诉

生成图片

Sora 2 之后，北京人形WoW具身世界模型带来aha时刻

标题：北京人形WoW具身世界模型引领机器人新突破近年来，机器人在运动能力上快速进步，如后空翻、跑酷等复杂动作已不在话下。然而，让机器人理解物理现象，比如水杯倒下后水为何洒出，依然是巨大挑战。近日，北京人形机器人创新中心开源了全新世界模型架构——WoW（World-Omniscient Worl...

原文链接

智慧轨迹

10-17 18:26:42

WoW具身世界模型

开源开放

物理一致性

分享至

打开微信扫一扫

内容投诉

生成图片

仅需一块GPU，李飞飞最新世界模型来了

昨日晚间，李飞飞团队发布全新世界模型RTFM，仅需单块H100 GPU即可实时生成交互式3D世界。该模型由World Labs开发，基于效率、可扩展性和持久性设计，旨在应对未来算力需求的激增。团队指出，传统架构生成4K+60FPS视频流的成本过高，而RTFM通过降低计算成本实现经济可行。近期，OpenAI与博通合作布局多元算力体系，推动成本下降。尽管如此，算力需求增长趋势未变，复杂模型仍需更高算力支持。此前9月，World Labs发布的Marble模型已能通过图片或文字生成多样化3D场景。当前，国内外多家公司加速布局世界模型领域，xAI、Meta、谷歌等均加入竞争，国内厂商如宇树、智元也已开源相关技术。分析认为，更便宜的算力将推动模型复杂度提升，支撑AI产业更高估值。

原文链接

新智燎原

10-17 18:25:16

世界模型

李飞飞

算力成本

分享至

打开微信扫一扫

内容投诉

生成图片

仅需一块GPU！“AI教母”公布最新世界模型算力需求“天花板”会更高吗？

10月17日，‘AI教母’李飞飞公布全新世界模型RTFM，由其创办的World Labs开发。该模型可在单块H100 GPU上运行，实时生成交互式3D世界，设计围绕效率、可扩展性和持久性三大原则。团队指出，随着世界模型技术发展，算力需求将远超当前大语言模型，传统架构难以支撑4K+60FPS视频流生成。World Labs认为，降低计算成本的技术将在市场中占优。近期，OpenAI与博通合作，构建多元算力体系以降低成本。尽管RTFM现仅需单GPU运行，但未来更大模型仍将推高算力需求。AI产业发展常伴随‘杰文斯悖论’，技术进步反而增加总资源消耗。此外，World Labs此前发布的Marble模型已能通过图片或文字生成多样化3D世界。目前，国内外多家公司正加速布局世界模型领域，分析师称更便宜的算力将推动复杂模型发展，AI算力需求的‘天花板’将进一步抬升。

原文链接

LunarCoder

10-17 17:26:37

AI教母

世界模型

算力需求

分享至

打开微信扫一扫

内容投诉

生成图片

李飞飞世界模型大更新，实时生成3D世界，只要一块GPU

2025年10月17日，李飞飞实验室The World Labs发布全新实时世界生成模型RTFM（Real-Time Frame Model）。该技术仅需单块H100 GPU即可高效运行，实时生成可供用户交互的3D世界。与九月中旬发布的Marble不同，RTFM不仅能从一张照片生成可自由探索的3D场景，还具备逼真的光影、反射和阴影效果。其核心基于端到端学习海量视频数据，无需传统图形学建模，直接从视频帧序列中学习世界规律。RTFM通过‘空间记忆’机制实现持续性交互，并优化计算需求，避免算力负担无限累积。目前，研究预览版Demo已上线，体验限时3分钟，但展示了未来虚拟世界的潜力。李飞飞团队认为，空间智能是通向AGI的重要方向。

原文链接

虚拟微光

10-17 13:16:18

RTFM

世界模型

李飞飞

分享至

打开微信扫一扫

内容投诉

生成图片

李飞飞发布全新世界模型，单GPU就能跑！

2025年10月，李飞飞团队发布全新世界模型RTFM（A Real-Time Frame Model），该模型支持实时运行、持久性和3D一致性，并仅需单张H100 GPU即可运行。RTFM设计遵循效率、可扩展性和持久性三大原则，能够以交互级帧率生成视频流并永久保存场景。与传统显式3D表征不同，RTFM通过神经网络从2D图像生成新视角内容，无需构建显式3D模型。此外，RTFM将姿态帧作为空间记忆，解决了自回归帧模型在持久性方面的挑战。目前，该模型已开放预览版体验，未来有望在媒体和机器人领域带来革命性影响。参考链接包括李飞飞及团队的社交媒体公告和博客。

原文链接

数码游侠

10-17 13:16:03

RTFM

世界模型

李飞飞

分享至

打开微信扫一扫

内容投诉

生成图片

李飞飞团队发布世界模型最新成果

10月16日，李飞飞团队发布全新世界模型RTFM（A Real-Time Frame Model）。该模型具备实时运行、持久性及3D一致性等特点，且仅需单张H100 GPU即可运行。这一成果展示了模型在效率与性能上的突破，为实时应用场景提供了更强大的技术支持。

原文链接

幻彩逻辑RainbowLogic

10-17 10:13:38

RTFM

世界模型

李飞飞

分享至

打开微信扫一扫

内容投诉

生成图片

马斯克从英伟达挖人做AI游戏！第一步：研发世界模型

2025年，马斯克旗下xAI团队入局世界模型研发，已从英伟达挖来资深研究员Zeeshan Patel和Ethan He。两人此前参与英伟达Omniverse平台开发，该平台被视为世界模型训练的核心工具。xAI计划将英伟达在图形与物理模拟的技术应用于其世界模型体系，目标是开发基于AI的电子游戏，预计2026年底前发布一款由世界模型驱动的游戏。目前团队正尝试实现AI生成自适应3D场景，并组建全模态团队研究多模态建模。此外，xAI还招聘‘电子游戏导师’，通过人类专家教授AI游戏机制与设计逻辑。马斯克称xAI使命是‘理解宇宙本质’，世界模型或成其AI帝国闭环关键。

原文链接

代码编织者Nexus

10-13 09:54:06

AI游戏

世界模型

马斯克

分享至

打开微信扫一扫

内容投诉

生成图片

挖走英伟达两员大将：马斯克 xAI 正开发“可用于游戏与机器人领域的世界模型”

10月12日，据《金融时报》报道，埃隆·马斯克旗下xAI公司正加速开发“世界模型”，与Meta、谷歌等竞争下一代AI系统。这类模型能理解物理和空间特性，应用于自主导航、游戏及机器人领域。xAI已从英伟达挖来两位专家：泽尚·帕特尔与何宜晖，推动相关研发。据悉，该技术可生成交互式3D环境，并有望拓展至人形机器人等实体产品。马斯克计划明年年底前推出一款AI生成的游戏，并于近期发布了升级版图像和视频生成模型。然而，世界模型面临数据不足与高成本的技术挑战。业内人士指出，AI虽强大，但游戏行业更需创新的世界构建能力。

原文链接

智能维度跳跃

10-12 19:46:52

xAI

世界模型

英伟达

分享至

打开微信扫一扫

内容投诉

生成图片

马斯克的xAI加入“世界模型”竞赛，以助力视频游戏开发

2025年10月12日，马斯克旗下xAI公司正加速开发“世界模型”，与Meta、谷歌等竞争，目标用于视频游戏和机器人领域。xAI今夏从英伟达挖来多名专家，致力于通过视频和机器人数据训练AI理解物理环境。该技术被认为是实现通用人工智能(AGI)的关键，能生成交互式3D环境并模拟未来状态。本周二，xAI发布大规模升级的图像与视频生成模型，并免费开放。马斯克计划明年年底前推出一款AI生成的游戏。此外，xAI正在招聘高薪技术人才，同时开放“视频游戏导师”职位，探索AI辅助游戏设计。不过，构建世界模型仍面临数据丰富性和成本挑战。

原文链接