4月18日,腾讯混元宣布开源定制化图像生成插件InstantCharacter,该插件可实现通过一张图加一句话生成任意角色在任意场景中的姿态。InstantCharacter兼容开源文生图模型Flux,角色一致性、画质和精度表现优异,支持灵活的文本编辑,适用于连环画、影片创作等场景。测试显示其效果媲美GPT 4o等模型。插件基于DiT模型构建创新框架,利用可扩展适配器与现代扩散变压器交互,同时借助包含千万级样本的大规模角色数据集优化身份一致性和文本可编辑性。项目已开源,相关资源包括官网、代码仓库及Hugging Face Demo页面。
原文链接
本文链接:https://kx.umi6.com/article/17443.html
转载请注明文章出处
相关推荐
.png)
换一换
腾讯混元图像2模型发布 支持文本、语音、草图等交互方式
2025-05-16 17:13:07
腾讯混元 T1-Vision 上线元宝:可深度理解图片内容
2025-05-12 21:40:45
小米大模型团队提出对角蛇形自回归图像生成方式
2025-04-18 17:22:44
435 文章
64520 浏览
24小时热文
更多

-
2025-07-19 15:54:36
-
2025-07-19 15:54:26
-
2025-07-19 14:57:21