可媲美GPT-4o的开源图像生成框架来了!腾讯联手InstantX解决角色一致性难题
腾讯混元与InstantX团队合作推出开源插件InstantCharacter,实现定制化角色生成。该插件基于DiTs(Diffusion Transformers),能高效生成并编辑个性化角色图像。
传统方法存在泛化性差、训练耗时等问题,而InstantCharacter通过两个核心创新解决这些难题:一是可扩展适配器,解析角色特征并与DiTs潜在空间交互;二是渐进式三阶段训练策略,提升角色一致性和文本可控性。
适配器采用full-transformer架构,结合SigLIP和DINOv2增强特征提取。训练分为三阶段:首先用未配对数据自重建,再以配对数据优化动作和风格,最后联合高分辨率图像提升细节质量。
实验显示,InstantCharacter在角色细节保留、文本可控性和风格灵活性上优于现有方法。插件及相关代码已开源,推动更多研究与应用。
原文链接
本文链接:https://kx.umi6.com/article/17775.html
转载请注明文章出处
相关推荐
换一换
清华系Sora全球上线!注册即用不排队,重点支持动漫风
2024-07-30 13:47:14
一张图 + 一句话实现任意角色场景姿势,腾讯混元宣布开源定制化图像生成插件 InstantCharacter
2025-04-18 20:22:57
谷歌 Gemini 2.5 Flash 升级 AI 修图功能,多项表现优于 GPT-4o
2025-08-27 09:00:44
阿里通义 Qwen-lmage-Edit-2511 图像编辑 AI 模型开源,支持两人隔空“合照”
2025-12-25 17:49:41
特斯拉:Cortex 2算力集群现已上线 并已开始运行训练任务
2026-04-23 08:58:08
美格智能发布新一代中央计算架构5G舱联AI模组
2026-04-24 15:18:33
昇腾超节点系列产品全面支持DeepSeek V4新模型
2026-04-24 13:15:05
特斯拉CFO:今年将豪掷250亿美元 押注AI与机器人
2026-04-23 11:04:57
SK海力士完成采购项目的招标 涉及250台人工智能服务器
2026-04-23 16:18:31
腾讯与阿里巴巴洽谈投资DeepSeek 估值超过200亿美元
2026-04-22 19:27:03
摩尔线程Day-0适配DeepSeek-V4
2026-04-24 18:28:12
阶跃与腾讯云合作打造新一代 AI 座舱解决方案
2026-04-23 19:26:30
成都出台人工智能产业人才九条 最高给予10亿元综合支持
2026-04-23 20:29:56
699 文章
558428 浏览
24小时热文
更多
-
2026-04-24 18:31:29 -
2026-04-24 18:30:24 -
2026-04-24 18:29:17