1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

超越ControlNet++!腾讯优图提出动态条件选择新架构

腾讯优图、南洋理工、浙大等机构联合推出DynamicControl,将多模态大语言模型的推理能力集成到文本生成图像任务中。DynamicControl提出一种高效多控制适配器,自适应选择不同条件,增强可控性而不牺牲图像质量。

基于ControlNet模型,前人探索了布局、分割图等控制信号,但存在局限。DynamicControl支持多种条件动态组合,自适应选择不同数量和类型的条件。算法流程包括双循环控制器产生真实排名分数,与预训练条件评估器结合训练。

双循环控制器优化条件和图像一致性,通过量化生成模型输出来增强优化。研究引入多模态大语言模型,用双周期控制器得分排序优化条件,确保高相关性和质量条件参与。多控制适配器动态编码,选择符合条件参与训练,提高模型效率。

实验显示,DynamicControl增强可控性,不牺牲图像质量和文本对齐。该研究为可控视觉生成提供新视角。

原文链接
本文链接:https://kx.umi6.com/article/10893.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
这次,Meta挖走了OpenAI真正的核心成员
2025-07-18 11:38:09
苹果AI雄心遭暴击:痛失AI王牌后 又有两名专家被Meta挖走
2025-07-18 11:39:16
7B模型“情商”比肩GPT-4o,腾讯突破开放域RL难题,得分直翻5倍
2025-07-18 16:42:29
24小时热文
更多
扫一扫体验小程序