1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:10秒创造一个世界!吴佳俊团队新作实时交互式3D世界生成

斯坦福大学吴佳俊团队与麻省理工学院合作的最新成果,让我们离实时生成开放世界游戏更进一步。通过单一图像,用户可在实时交互下生成无限延展的3D场景。

只需上传一张图片,即可进入由AI创造的虚拟世界。用户通过移动视角和输入文本提示,实时决定接下来的探索方向和场景内容。

从鸟瞰视角可以看到虚拟世界的生成过程。无论是魔幻森林、现实都市还是宁静乡村,WonderWorld都能瞬间呈现。

这项技术名为WonderWorld,由斯坦福大学吴佳俊团队和麻省理工学院共同研发。WonderWorld提供交互式场景,用户可从第一视角进行移动。

资深游戏创业者、GOAT Gaming的首席AI官对此表示兴奋:“它还能处理非真实感的图片,有无限可能!”在硅谷广受欢迎的Hacker News上,WonderWorld一度成为热门话题。

传统生成式AI方法需数十分钟或数小时生成场景,而WonderWorld仅需10秒,真正开启了实时交互式3D世界生成的大门。

WonderWorld的核心突破在于其惊人的速度。研究团队开发的FLAGS(Fast LAyered Gaussian Surfels)场景表示方法,能在10秒内生成新场景,比现有方法快近100倍。

WonderWorld生成新场景时,先生成一张2D图片,再从图片生成三张layer images,最后生成FLAGS表示。FLAGS由三层Gaussian surfels组成:天空层、背景层和前景层,每一层都从对应的layer image生成。FLAGS表示的每个Gaussian surfel对应layer image上的像素,可使用估计的像素级别几何信息来加速优化过程。

WonderWorld还提出Guided depth diffusion,利用已生成3D场景的深度信息作为指导,确保新场景的深度与之匹配,避免几何裂缝。

实验结果显示,WonderWorld明显优于其他基准方法,并且更受用户偏爱。从一张输入图片,WonderWorld可根据不同用户控制生成不同场景内容。

主要作者来自斯坦福大学吴佳俊团队。论文一作俞洪兴,斯坦福大学五年级博士生,研究领域为重建可交互的物理世界。吴佳俊现任斯坦福大学助理教授,曾是清华大学姚班学生,被誉为“清华十大学神”之一。论文链接:https://arxiv.org/pdf/2406.09394

参考链接: [1] https://x.com/Koven_Yu/status/1835769026934673595 [2] https://kovenyu.com/wonderworld

原文链接
本文链接:https://kx.umi6.com/article/7904.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
通义大模型开源发布3D数字人大模型
2025-04-08 09:47:24
一张图生成高质量广视野3D场景,还可控制摄像轨迹
2024-12-30 21:27:30
生成式人工智能入门
2024-05-07 16:26:45
AI 搜索热潮背后:注定要逾越场景的门槛
2024-07-05 09:41:57
上海徐汇发布六大“人工智能+城市治理”场景
2025-04-16 10:07:40
美图创始人吴欣鸿:未来“生成”会比“拍摄”更普遍
2024-06-12 20:23:20
全球首个港口服务类大模型方舟 TaaS 开启公测,支持智能规划路线并估算费用
2025-01-27 08:23:11
10秒创造一个世界!吴佳俊团队新作实时交互式3D世界生成
2024-10-26 17:32:09
高德AI助手“小高老师”单日调用量12亿次
2025-09-10 11:37:23
OpenAI否认因重组遇阻而考虑将总部迁出加州
2025-09-09 18:19:40
文心X1.1发布!这三大能力突出,一手实测在此
2025-09-09 21:21:16
全球首款“边走边讲边演示”人形机器人:魔法原子发布智慧导览解决方案
2025-09-09 21:23:51
工信部部长李乐成:拓展“人工智能+”典型应用场景 加快新技术新产品新场景大规模应用落地
2025-09-10 13:38:08
24小时热文
更多
扫一扫体验小程序