标题:轻量化虚拟试衣新框架——CatVTON
只需两张图像,不到30秒,就能实现虚拟试衣奇技,让马斯克穿上牛仔走红毯,或让寡姐展示国风Polo衫。这背后是中山大学、Pixocial等机构联合发布的CatVTON轻量化模型架构,它以Stable Diffusion v1.5 inpainting为基础,实现了传统平铺服装图到人物的换装。
CatVTON功能概览: - 服饰种类广泛:无论上衣、裤子、裙子还是套装,各种品类的服装均可轻松试穿。 - 一致性和自然度:保持服装的形状和纹理高度一致,换装效果自然流畅。 - 人物间换装:无需明确类别,根据Mask的不同,实现从一个人物到另一个人物的服装转换,支持单一或组合服装更换。
CatVTON模型架构亮点: - 简洁高效:仅需2个网络模块(VAE+UNet)。 - 参数优化:总参数量899.06M,推理显存需求小于8G(输出图像大小为1024×768)。 - 模块化精简:通过观察现有方法的模块冗余,CatVTON在设计中去除了不必要的组件,如Warping方法的几何匹配、扩散模型中的ReferenceNet,以及T2I任务中的文本交叉注意力,从而实现了模型架构的轻量化。
训练策略: - 研究了扩散模型预训练与TryOn任务之间的联系,确认了关键模块——Self Attention的重要性,该模块仅占总参数量的5.71%,微调这部分就可达到逼真的试穿效果。
CatVTON不仅实现了功能的丰富多样性,而且通过轻量化的设计,显著降低了模型的训练和推理成本,为虚拟试衣技术的广泛应用提供了坚实的基础。项目主页及论文详情请参阅链接:
原文链接
本文链接:https://kx.umi6.com/article/4303.html
转载请注明文章出处
相关推荐
换一换
寡姐带货国风Polo衫,马斯克穿牛仔走红毯!虚拟试衣新框架火了
2024-07-31 15:07:46
寡姐带货国风 Polo 衫、马斯克穿牛仔走红毯:虚拟试衣新框架,只需两张图 30 秒即生成
2024-07-30 22:12:57
OPPO与蚂蚁集团签署战略合作 将共建AI智能体等
2025-10-24 12:40:26
对冲基金大佬对AI热潮“敬而远之”,更青睐这项技术……
2025-10-23 16:10:22
新研究揭穿Claude底裤,马斯克盖棺定论
2025-10-23 15:05:55
特斯拉人形机器人再延期,消息称因为双手只能用六星期
2025-10-24 19:49:44
马斯克:特斯拉 Optimus 机器人将成为“令人难以置信的外科医生”
2025-10-24 11:34:35
OpenAI收购由前苹果员工创立的人工智能初创公司
2025-10-24 01:20:07
肖远企:目前AI在金融领域的应用仍处于早期阶段 无法取代人的决策
2025-10-23 16:12:32
我国网络安全法修正草案拟完善 AI 伦理规范,加强安全监管
2025-10-23 15:10:09
Reddit 起诉 Perplexity,指控后者未经授权为 AI 抓取和使用数据
2025-10-23 16:09:59
2025豫台经贸洽谈会开幕 签约近300亿元合作项目
2025-10-24 13:37:40
AI推动芯片需求!英特尔三季报超预期 盘后股价大涨近9%
2025-10-24 09:33:43
529 文章
259583 浏览
24小时热文
更多
-
2025-10-24 22:57:14 -
2025-10-24 21:54:02 -
2025-10-24 21:53:50