1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

可媲美GPT-4o的开源图像生成框架来了!腾讯联手InstantX解决角色一致性难题

腾讯混元与InstantX团队合作推出开源插件InstantCharacter,实现定制化角色生成。该插件基于DiTs(Diffusion Transformers),能高效生成并编辑个性化角色图像。

传统方法存在泛化性差、训练耗时等问题,而InstantCharacter通过两个核心创新解决这些难题:一是可扩展适配器,解析角色特征并与DiTs潜在空间交互;二是渐进式三阶段训练策略,提升角色一致性和文本可控性。

适配器采用full-transformer架构,结合SigLIP和DINOv2增强特征提取。训练分为三阶段:首先用未配对数据自重建,再以配对数据优化动作和风格,最后联合高分辨率图像提升细节质量。

实验显示,InstantCharacter在角色细节保留、文本可控性和风格灵活性上优于现有方法。插件及相关代码已开源,推动更多研究与应用。

原文链接
本文链接:https://kx.umi6.com/article/17775.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
谷歌 Gemini 2.5 Flash 升级 AI 修图功能,多项表现优于 GPT-4o
2025-08-27 09:00:44
一张图 + 一句话实现任意角色场景姿势,腾讯混元宣布开源定制化图像生成插件 InstantCharacter
2025-04-18 20:22:57
可媲美GPT-4o的开源图像生成框架来了!腾讯联手InstantX解决角色一致性难题
2025-04-25 17:17:07
清华系Sora全球上线!注册即用不排队,重点支持动漫风
2024-07-30 13:47:14
商汤日日新为 Claude API 用户提供“搬家”服务:可获 5000 万 Tokens 体验包
2025-09-06 15:35:37
AI收入超预期!芯片巨头博通交出满分财报 神秘百亿订单带来惊喜
2025-09-05 09:15:08
躺不平的企业微信
2025-09-06 10:32:35
OpenAI 明年杀入招聘市场,将帮助具备 AI 技能的人才找到工作
2025-09-05 16:21:28
美国加州、特拉华州检察长警告 OpenAI:对伤害儿童的行为应当零容忍
2025-09-06 21:38:26
智谱打响中场战事
2025-09-06 06:30:37
一键照片“手办化”:谷歌 Gemini 上线“Nano Banana”文生图模型,无需访问 AI Studio
2025-09-06 22:39:24
2025世界智能产业博览会签约项目金额超2000亿元
2025-09-05 18:26:52
特斯拉自研芯片新进展 AI5完成设计评审 马斯克:将成“史诗级”产品
2025-09-07 09:43:44
24小时热文
更多
扫一扫体验小程序