1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

中山大学和字节智创数字人团队联手开发了一种创新的虚拟试穿技术,称为MMTryon。这个框架允许用户通过输入服装图像和简单的文本指令,如“大衣+牛仔裤+包”,实现多件衣物的按需组合试穿,无论真人或卡通形象都能适用。MMTryon的关键在于其强大的服装编码器,能处理复杂换装场景和各种款式的服装,且无需依赖繁琐的服装分割。

MMTryon采用多模态多参考注意机制,解决了传统换装技术的局限,如不能自定义着装细节和依赖精确分割的问题。通过预训练的服装编码器和数据增强技术,它能在无分割的情况下生成逼真的组合换装效果。在基准测试中,MMTryon的表现超越了现有最佳解决方案(SOTA),并在人类评价中表现出色,尤其在复杂场景下,更受用户喜爱。

论文详细介绍了技术原理和实验结果,对虚拟时尚领域具有重要意义。

原文链接
本文链接:https://kx.umi6.com/article/2431.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
多亏Transformer,Mamba更强了!仅用1%计算量达新SOTA
2024-08-22 17:19:58
月之暗面发布 Kimi k1.5 多模态思考模型,实现 SOTA 级多模态推理能力
2025-01-20 23:25:35
阶跃星辰发布端到端语音大模型 Step-Audio 2 mini,多个基准测试取得 SOTA 成绩
2025-09-01 15:21:09
谷歌AI试穿神器真神了!上传照片秒出OOTD,视频效果和照镜子没区别
2025-06-27 17:13:51
1/15成本,实现AI水印新SOTA | 南洋理工大学&A*STAR
2025-05-31 13:06:45
腾讯混元 OCR 模型宣布开源:参数仅 1B,多项核心能力 SOTA
2025-11-25 14:56:08
网上买衣服可虚拟试穿,谷歌 AI 搜索新功能亮相
2025-05-21 02:54:02
达摩院开源VideoLLaMA3:仅7B大小,视频理解拿下SOTA | 在线可玩
2025-02-14 12:34:39
月之暗面发布k1.5多模态思考模型
2025-01-20 23:27:40
美团发布高效推理模型 LongCat-Flash-Thinking,达到 SOTA 水平
2025-09-22 15:58:35
Claude Opus 4.1火速发布!坐稳编程之王,官方:马上还有大更新
2025-08-06 11:26:58
4090玩转大场景几何重建,RGB渲染和几何精度达SOTA|上海AI Lab&西工大新研究
2025-04-13 19:51:00
按需搭配一键叠穿,效果拿下新SOTA!中山大学&字节智创数字人团队提出虚拟试穿新框架
2024-07-02 14:50:22
24小时热文
更多
扫一扫体验小程序