
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
昨日晚间,李飞飞团队发布全新世界模型RTFM,仅需单块H100 GPU即可实时生成交互式3D世界。该模型由World Labs开发,基于效率、可扩展性和持久性设计,旨在应对未来算力需求的激增。团队指出,传统架构生成4K+60FPS视频流的成本过高,而RTFM通过降低计算成本实现经济可行。近期,OpenAI与博通合作布局多元算力体系,推动成本下降。尽管如此,算力需求增长趋势未变,复杂模型仍需更高算力支持。此前9月,World Labs发布的Marble模型已能通过图片或文字生成多样化3D场景。当前,国内外多家公司加速布局世界模型领域,xAI、Meta、谷歌等均加入竞争,国内厂商如宇树、智元也已开源相关技术。分析认为,更便宜的算力将推动模型复杂度提升,支撑AI产业更高估值。
原文链接
2025年10月17日,李飞飞实验室The World Labs发布全新实时世界生成模型RTFM(Real-Time Frame Model)。该技术仅需单块H100 GPU即可高效运行,实时生成可供用户交互的3D世界。与九月中旬发布的Marble不同,RTFM不仅能从一张照片生成可自由探索的3D场景,还具备逼真的光影、反射和阴影效果。其核心基于端到端学习海量视频数据,无需传统图形学建模,直接从视频帧序列中学习世界规律。RTFM通过‘空间记忆’机制实现持续性交互,并优化计算需求,避免算力负担无限累积。目前,研究预览版Demo已上线,体验限时3分钟,但展示了未来虚拟世界的潜力。李飞飞团队认为,空间智能是通向AGI的重要方向。
原文链接
2025年10月,李飞飞团队发布全新世界模型RTFM(A Real-Time Frame Model),该模型支持实时运行、持久性和3D一致性,并仅需单张H100 GPU即可运行。RTFM设计遵循效率、可扩展性和持久性三大原则,能够以交互级帧率生成视频流并永久保存场景。与传统显式3D表征不同,RTFM通过神经网络从2D图像生成新视角内容,无需构建显式3D模型。此外,RTFM将姿态帧作为空间记忆,解决了自回归帧模型在持久性方面的挑战。目前,该模型已开放预览版体验,未来有望在媒体和机器人领域带来革命性影响。参考链接包括李飞飞及团队的社交媒体公告和博客。
原文链接
10月16日,李飞飞团队发布全新世界模型RTFM(A Real-Time Frame Model)。该模型具备实时运行、持久性及3D一致性等特点,且仅需单张H100 GPU即可运行。这一成果展示了模型在效率与性能上的突破,为实时应用场景提供了更强大的技术支持。
原文链接
2025年11月15日截止的首届BEHAVIOR家务挑战赛由李飞飞团队发起、英伟达赞助,旨在推动具身智能发展。参赛者需用星海图R1 Pro机器人在虚拟家庭环境中完成50项家务任务,涵盖清洁、烹饪等,可选标准或特权赛道。评分标准包括任务完成率、模拟时间等,最终排名以平均任务完成率为主,前三名可获最高1000美元奖金及RTX 5080。李飞飞表示,BEHAVIOR受ImageNet启发,目标是解决机器人学习标准化不足、数据匮乏等问题,并强调‘以人为中心’的理念。比赛覆盖1000个家庭活动,提出跨房间导航、双手操控等能力要求,被视为具身智能领域的‘北极星’任务。更多详情见官网。
原文链接
2025年9月17日,斯坦福大学教授李飞飞创立的World Labs发布空间智能新成果Marble。Marble是一个基于Beta测试版的3D世界生成平台,用户可通过官网(marble.worldlabs.ai)创建和探索AI生成的3D场景。该技术通过输入一张照片,自动生成包含几何结构、光照、材质等细节的庞大虚拟世界,并支持导出用于后续项目。目前支持VR交互,但尚不支持人物或动物模型生成。李飞飞强调,空间智能将推动三维世界的创造与应用,为游戏、叙事、社交等领域带来革新。与此同时,AI游戏生态链正快速成型,马斯克等科技巨头也纷纷布局AI游戏领域。Marble的推出标志着普通人创建复杂虚拟世界的起点,未来潜力巨大。
原文链接
2025年9月17日,李飞飞创业团队World Labs发布全新世界模型成果,可通过一个提示生成无限扩展的3D世界。新模型具备更大规模、多样化风格和清晰几何结构,支持无缝拼接场景,构建持久且可导航的虚拟环境。用户可在浏览器中自由探索,并导出高斯点云用于下游项目。该模型注重风格一致性与几何连贯性,适用于游戏、创作等多领域。目前,beta版本已上线,用户可通过Marble平台申请试用。李飞飞强调,与谷歌Genie不同,其模型生成的世界永久存在且免费访问,已获早期用户积极评价。
原文链接
AI教母李飞飞一年前关于大语言模型局限性的访谈近日被重新热议。她指出,语言是人类生成的信号,无法独立于人存在,而物理世界是客观的,当前基于一维语言信号训练的模型难以真正理解三维现实。研究显示,Claude 3.5、GPT-4o等多模态模型在物理常识测试中表现远不及人类儿童,甚至不如专用机器人;在物理推理和视觉任务中,这些模型也暴露出显著缺陷。尽管如此,讨论中也有观点认为语言描述可能优于感知,或人工智能可创造自己的语言来理解世界。这一话题再次引发对AI智能本质的深度思考。
原文链接
标题:李飞飞自曝创业经历:因眼睛受伤坚定打造世界模型
正文:
“AI教母”李飞飞在a16z播客中透露,五年前因角膜损伤失去立体视觉的经历,让她更加坚定了构建世界模型的决心。“即使凭借经验能想象三维世界,单眼视物让我开始害怕开车。”这段经历使她认识到立体视觉对空间交互的重要性,如同语言模型依赖...
原文链接
李飞飞创办的World Labs正在探索下一代AI系统,开发具备“空间智能”的技术。这家公司在三个月内完成两轮融资,累计融资2.3亿美元,成为AI领域的独角兽企业。投资方包括a16z、Radical Ventures等。
李飞飞认为AI正从语言模型转向世界建模。她指出语言模型虽重要,但无法完全还原真实世界的全貌。真正的智能需理解并构建三维世界,这是实现通用智能的关键一步。
World Labs致力于开发能够理解、重构三维世界的技术,如NeRF、高斯平面表示法和扩散模型等。这些技术可应用于游戏、建筑设计、机器人导航及数字孪生等领域。然而,目前仍面临数据获取难、算力需求高及泛化能力不足等问题。
李飞飞强调AI发展需多学科融合与跨领域合作。同时,她呼吁关注AI与社会的关系,包括教育、法律及伦理等方面。她相信未来AI不仅是工具,更是人类在物理世界中的智能延伸,将促进人机协作与社会进步。
原文链接
加载更多

暂无内容