1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

360AI推出DiT架构下“省钱版”ControlNet,参数量骤减85%,性能达SOTA!

RelaCtrl团队投稿至凹非寺量子位 | 公众号QbitAI

现有可控Diffusion Transformer方法虽在文本到图像和视频生成方面取得进展,但也带来大量参数和计算开销。同时,这些方法未能有效考虑不同Transformer层之间控制信息的相关性,导致资源分配效率低下。

360人工智能研究院提出新一代控制相关性引导的高效可控生成框架——RelaCtrl。该框架通过优化控制信号集成方式,实现更高效且资源优化的控制,解决上述问题。

团队对常见T2I Diffusion Transformer进行实验验证,取得显著成果。论文一作为中国科学技术大学二年级硕士生曹可,共同一作和项目负责人为360 AI Research AIGC研究员马傲。

研究动机: DiT的可控生成方法提升生成结果保真度和一致性,但仍面临参数和计算负担重,以及控制信息相关性被忽视的问题。受模型量化和剪枝研究启发,团队设计了“ControlNet相关性得分”,指导后续可控生成的条件注入。

实验结果: RelaCtrl在多种条件下展现强大性能,参数量减少约85%,计算复杂度显著降低。定性比较显示其生成图像逼真,定量分析表明其在控制指标、视觉质量和文本相似度上更优。

原文链接
本文链接:https://kx.umi6.com/article/14619.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
商务部新闻发言人就美批准对华销售英伟达H20芯片有关情况答记者问
2025-07-18 14:44:21
马斯克的 Grok“AI 男友”有名字了:火星科幻小说《异乡异客》主人公瓦伦丁
2025-07-18 17:43:33
Meta拒签欧盟通用人工智能行为准则,批其过度干预并带来不确定性
2025-07-18 22:47:06
24小时热文
更多
扫一扫体验小程序