4月18日,腾讯混元宣布开源定制化图像生成插件InstantCharacter,该插件可实现通过一张图加一句话生成任意角色在任意场景中的姿态。InstantCharacter兼容开源文生图模型Flux,角色一致性、画质和精度表现优异,支持灵活的文本编辑,适用于连环画、影片创作等场景。测试显示其效果媲美GPT 4o等模型。插件基于DiT模型构建创新框架,利用可扩展适配器与现代扩散变压器交互,同时借助包含千万级样本的大规模角色数据集优化身份一致性和文本可编辑性。项目已开源,相关资源包括官网、代码仓库及Hugging Face Demo页面。
原文链接
本文链接:https://kx.umi6.com/article/17443.html
转载请注明文章出处
相关推荐
换一换
真如摄影、细至发丝!阿里开源新一代图像生成模型Qwen-Image
2025-12-31 21:40:29
阿里开源图像生成模型 Qwen-Image-Layered:能像 PS 一样分图层编辑
2025-12-22 17:54:03
OpenAI 将 ChatGPT 新图像生成技术引入 API,每张图约 2 美分起
2025-04-24 08:29:07
给大模型生图“去油”,腾讯混元新研究 SRPO 公布
2025-09-17 21:36:40
可能是目前效果最好的开源生图模型,混元生图3.0来了
2025-09-30 21:34:24
谷歌nano banana官方最强Prompt模板来了!先收藏再说
2025-09-03 16:47:50
微软 Copilot 已支持 GPT-4o 图像生成技术,能力大提升
2025-05-19 19:24:47
独家丨前阿里通义视觉负责人薄列峰,已加入腾讯混元团队
2025-07-27 19:02:28
腾讯混元开源翻译模型 1.5:手机 1GB 内存即可运行,效果超越商用 API
2025-12-30 16:27:33
腾讯混元 OCR 模型宣布开源:参数仅 1B,多项核心能力 SOTA
2025-11-25 14:56:08
腾讯混元推出 ETC 领域首款 AI 智能体,问题解决率达 90%
2025-12-25 15:41:35
腾讯混元3D生成模型正式发布2.5版本新模型
2025-04-23 13:58:25
腾讯混元图像2模型发布 支持文本、语音、草图等交互方式
2025-05-16 17:13:07
745 文章
594660 浏览
24小时热文
更多
-
2026-04-24 20:31:56 -
2026-04-24 20:29:51 -
2026-04-24 19:29:38