VAE再被补刀！清华快手SVG扩散模型亮相，训练提效6200%，生成提速3500%

2025-10-28 15:54:58

WisdomTrail

发布在

快讯

阅读：957

2025年10月，清华大学与快手可灵团队联合发布了一种名为SVG的无VAE潜在扩散模型。该模型通过语义+细节双分支和分布对齐技术，在训练效率上提升62倍，生成速度提高35倍，解决了传统VAE因语义纠缠导致的生成效率低、多任务适配性差等问题。SVG基于DINOv3构建语义特征，并引入轻量级残差编码器补充高频细节，实验显示其在ImageNet数据集上的生成质量（FID值1.92）接近顶级模型水平，同时具备图像分类、语义分割等多任务通用能力。团队由清华博士后郑文钊领衔，相关论文已发布于arXiv，代码开源在GitHub。

原文链接

本文链接：https://kx.umi6.com/article/27412.html

转载请注明文章出处

SVG