北大团队引领3D生成与对齐革新:OctGPT打破扩散模型垄断
近年来,三维形状生成(3D AIGC)技术迅猛发展,成为数字内容创作的重要推动力,尤其在游戏、影视、虚拟现实及工业设计领域展现巨大潜力。
北京大学陈宝权教授团队在三维生成与对齐方面取得突破。他们提出了基于八叉树的3D自回归生成模型OctGPT,打破了扩散模型在三维生成领域的垄断地位,相关论文已被SIGGRAPH 2025接收。此外,团队还设计了仅需单个先验的三维物体对齐框架,并构建了覆盖最广的规范化3D数据集,用于提升生成质量,该成果已被CVPR 2025接收。
OctGPT通过八叉树表达三维形状,结合GPT架构实现高质量生成。它支持文本、图像等多种条件驱动,序列长度扩展至50k,显著提升了细节捕捉能力。模型采用基于窗口注意力的高效自回归机制,训练速度提升13倍,推理速度提升69倍,大幅降低了硬件需求。
在对齐方面,团队提出了一种one-shot方法,仅需一个先验模型即可实现同类物体的高效对齐。该方法结合语义与几何信息,通过支撑面初始化策略和能量函数优化,实现了高精度与鲁棒性。基于此,团队构建了包含1054个类别、32,000个物体的规范化数据集COD,广泛应用于3D生成与具身智能领域。
这些创新不仅推动了三维生成技术的发展,也为多模态三维建模开辟了新路径,展现出广阔的应用前景。
原文链接
本文链接:https://kx.umi6.com/article/17774.html
转载请注明文章出处
相关推荐
.png)
换一换
3个月估值10亿,李飞飞空间智能首个模型诞生!
2024-12-05 11:58:26
5秒完成3D生成,合成数据集已开源,上交港中文框架超越Instant3D
2024-06-09 16:15:46
国产3D生成大模型火爆外网!歪果仁年都不过了,都在测这个
2025-01-17 17:19:21
385 文章
45933 浏览
24小时热文
更多

-
2025-07-19 21:58:20
-
2025-07-19 21:57:13
-
2025-07-19 20:57:00