1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:10秒创造一个世界!吴佳俊团队新作实时交互式3D世界生成

斯坦福大学吴佳俊团队与麻省理工学院合作的最新成果,让我们离实时生成开放世界游戏更进一步。通过单一图像,用户可在实时交互下生成无限延展的3D场景。

只需上传一张图片,即可进入由AI创造的虚拟世界。用户通过移动视角和输入文本提示,实时决定接下来的探索方向和场景内容。

从鸟瞰视角可以看到虚拟世界的生成过程。无论是魔幻森林、现实都市还是宁静乡村,WonderWorld都能瞬间呈现。

这项技术名为WonderWorld,由斯坦福大学吴佳俊团队和麻省理工学院共同研发。WonderWorld提供交互式场景,用户可从第一视角进行移动。

资深游戏创业者、GOAT Gaming的首席AI官对此表示兴奋:“它还能处理非真实感的图片,有无限可能!”在硅谷广受欢迎的Hacker News上,WonderWorld一度成为热门话题。

传统生成式AI方法需数十分钟或数小时生成场景,而WonderWorld仅需10秒,真正开启了实时交互式3D世界生成的大门。

WonderWorld的核心突破在于其惊人的速度。研究团队开发的FLAGS(Fast LAyered Gaussian Surfels)场景表示方法,能在10秒内生成新场景,比现有方法快近100倍。

WonderWorld生成新场景时,先生成一张2D图片,再从图片生成三张layer images,最后生成FLAGS表示。FLAGS由三层Gaussian surfels组成:天空层、背景层和前景层,每一层都从对应的layer image生成。FLAGS表示的每个Gaussian surfel对应layer image上的像素,可使用估计的像素级别几何信息来加速优化过程。

WonderWorld还提出Guided depth diffusion,利用已生成3D场景的深度信息作为指导,确保新场景的深度与之匹配,避免几何裂缝。

实验结果显示,WonderWorld明显优于其他基准方法,并且更受用户偏爱。从一张输入图片,WonderWorld可根据不同用户控制生成不同场景内容。

主要作者来自斯坦福大学吴佳俊团队。论文一作俞洪兴,斯坦福大学五年级博士生,研究领域为重建可交互的物理世界。吴佳俊现任斯坦福大学助理教授,曾是清华大学姚班学生,被誉为“清华十大学神”之一。论文链接:https://arxiv.org/pdf/2406.09394

参考链接: [1] https://x.com/Koven_Yu/status/1835769026934673595 [2] https://kovenyu.com/wonderworld

原文链接
本文链接:https://kx.umi6.com/article/7904.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
一张图生成高质量广视野3D场景,还可控制摄像轨迹
2024-12-30 21:27:30
通义大模型开源发布3D数字人大模型
2025-04-08 09:47:24
上海徐汇发布六大“人工智能+城市治理”场景
2025-04-16 10:07:40
10秒创造一个世界!吴佳俊团队新作实时交互式3D世界生成
2024-10-26 17:32:09
AI 搜索热潮背后:注定要逾越场景的门槛
2024-07-05 09:41:57
美图创始人吴欣鸿:未来“生成”会比“拍摄”更普遍
2024-06-12 20:23:20
生成式人工智能入门
2024-05-07 16:26:45
全球首个港口服务类大模型方舟 TaaS 开启公测,支持智能规划路线并估算费用
2025-01-27 08:23:11
英伟达ACE技术加持!《绝地求生》将引入AI队友系统
2025-11-02 11:20:56
澳大利亚警方借助 AI 解码犯罪分子常用 emoji“弦外之音”,遏制网络犯罪
2025-10-31 12:29:47
国产EDA迈入AI时代!芯和半导体发布2025软件集
2025-11-02 16:33:52
谷歌“通吃”AI
2025-11-01 10:23:33
高通机架级 AI 推理系统获沙特订单,HUMAIN 将部署 200MW
2025-11-02 11:19:59
24小时热文
更多
扫一扫体验小程序