NTU S-Lab 团队探索可动 3D 新方向:结构、关节、纹理一次到位
在生成式 AI 进军三维空间的背景下,如何让机器理解物体的结构、关节和运动方式成为研究热点。南洋理工大学 S-Lab 团队提出了一种统一建模框架,能够从单张图像生成具备真实几何结构、准确关节参数和自然外观纹理的可动三维对象,在几何精度、外观一致性和运动合理性上表现优异。
该框架结合结构化潜空间、扩散式 3D 生成和关节感知纹理建模,解决了现有方法对完整三维扫描的依赖、结构与纹理分离建模的不一致性,以及运动可见性变化带来的难题。实验表明,模型在几何结构完整度、关节运动稳定性和外观真实度等方面均优于现有技术,并展现出良好的跨数据集泛化能力。
具体而言,团队将流程分为结构学习、潜空间生成和外观学习三个阶段。首先,通过稀疏三维体素表示捕捉物体的结构与关节信息,并利用变分自编码器压缩为紧凑的潜编码;接着,训练扩散模型生成可动结构;最后,通过关节感知外观微调策略解决运动后纹理缺失或异常的问题。这种方法确保生成的物体在不同关节状态下保持纹理连贯且自然。
这一研究的意义在于构建了一个真正可扩展的可动三维生成框架,大幅降低了创建三维内容的门槛。仅需一张普通图像,即可生成结构合理、关节设置正确、外观逼真的可动三维对象,适用于虚拟现实、游戏制作、机器人学习等领域。此外,该方法具有强大的泛化能力,可推广至机械设备、生物体骨骼等复杂系统。
论文地址:https://arxiv.org/pdf/2510.21432
首批雷峰网 GAIR 2025 重磅嘉宾名单已揭晓,更多行业领军者将齐聚深圳,共探智能未来。
原文链接
本文链接:https://kx.umi6.com/article/29666.html
转载请注明文章出处
相关推荐
换一换
NTU S-Lab 团队探索可动 3D 新方向:结构、关节、纹理一次到位
2025-12-04 16:32:23
Meta挖走苹果顶级设计师 加速AI硬件布局
2025-12-04 20:45:13
豆包手机助手:已下线操作银行、互联网支付类APP的能力
2025-12-06 18:44:32
哈佛民调:59% 美国年轻人认为 AI 会威胁自身就业前景
2025-12-05 00:53:13
OpenAI最快将于下周二发布GPT-5.2
2025-12-06 07:18:55
Sora APP 30天留存率:1%
2025-12-04 19:38:22
豆包手机助手宣布调整AI操作手机能力:限制金融类、游戏类应用场景
2025-12-05 11:22:55
“AI教父”警告:盖茨、马斯克没说错 数百万劳动者将被时代抛弃
2025-12-05 15:36:18
Sensor Tower:2025 谷歌 Gemini 强势上位,三项核心 AI 增长指标反超 ChatGPT
2025-12-06 15:35:30
商务部部长王文涛:促进大宗耐用商品消费 推动“人工智能+消费”
2025-12-05 18:46:28
“AI 教母”李飞飞抨击 AI 宣传两极化:要么世界末日,要么乌托邦
2025-12-05 16:41:16
瑞银证券:现阶段中国出现“AI泡沫”的可能性不大
2025-12-05 16:44:39
漫剧满足了群众吃「电子路边摊」的需求
2025-12-05 14:32:40
561 文章
307028 浏览
24小时热文
更多
-
2025-12-07 10:27:01 -
2025-12-07 10:25:53 -
2025-12-07 10:24:46