
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
标题:轻量化虚拟试衣新框架——CatVTON
只需两张图像,不到30秒,就能实现虚拟试衣奇技,让马斯克穿上牛仔走红毯,或让寡姐展示国风Polo衫。这背后是中山大学、Pixocial等机构联合发布的CatVTON轻量化模型架构,它以Stable Diffusion v1.5 inpainting为基础...
原文链接
【实时报道】近日,中山大学及Pixocial等机构联合发布了轻量化虚拟试衣模型CatVTON,该模型仅需用户上传两张图片,30秒内即可完成虚拟试衣,无论是一般服饰还是二次元换装都轻松应对。CatVTON以Stable Diffusion v1.5 inpainting为基础,通过两个网络模块(VAE+UNet)和899.06M总参数量实现高效运行,模型大小仅需<8G推理显存,输出分辨率可达1024×768,展现出卓越的轻量化优势。此创新技术不仅提升了虚拟试衣的效率与体验,且在训练上优化了模块选择,证实了Self Attention是关键模块,使得可训练参数量减少至总参数量的5.71%,大幅降低训练与推理成本。CatVTON的发布标志着虚拟试衣领域的一大突破,有望加速虚拟试衣技术的应用与普及。感兴趣的读者可访问项目主页或查阅论文了解详情。
原文链接
加载更多

暂无内容