360AI推出DiT架构下“省钱版”ControlNet,参数量骤减85%,性能达SOTA!
RelaCtrl团队投稿至凹非寺量子位 | 公众号QbitAI
现有可控Diffusion Transformer方法虽在文本到图像和视频生成方面取得进展,但也带来大量参数和计算开销。同时,这些方法未能有效考虑不同Transformer层之间控制信息的相关性,导致资源分配效率低下。
360人工智能研究院提出新一代控制相关性引导的高效可控生成框架——RelaCtrl。该框架通过优化控制信号集成方式,实现更高效且资源优化的控制,解决上述问题。
团队对常见T2I Diffusion Transformer进行实验验证,取得显著成果。论文一作为中国科学技术大学二年级硕士生曹可,共同一作和项目负责人为360 AI Research AIGC研究员马傲。
研究动机: DiT的可控生成方法提升生成结果保真度和一致性,但仍面临参数和计算负担重,以及控制信息相关性被忽视的问题。受模型量化和剪枝研究启发,团队设计了“ControlNet相关性得分”,指导后续可控生成的条件注入。
实验结果: RelaCtrl在多种条件下展现强大性能,参数量减少约85%,计算复杂度显著降低。定性比较显示其生成图像逼真,定量分析表明其在控制指标、视觉质量和文本相似度上更优。
原文链接
本文链接:https://kx.umi6.com/article/14619.html
转载请注明文章出处
相关推荐
换一换
「网红」周鸿祎,要为 AI 带货
2024-06-20 12:02:53
让机器人行动更有依据:复旦等提出 GuidedVLA,提升 VLA 可控可解释能力
2026-06-08 11:27:33
AI需求井喷!台积电CEO:数年难以填满芯片缺口
2026-06-04 17:14:24
覆盖20多个垂直场景Agent!腾讯首发效率智能体工具集
2026-06-05 17:08:27
AI“吹大”的美股泡沫有多大?高盛:确有过热 但未至历史极端水平
2026-06-08 16:35:40
马斯克SpaceX路演PPT:60页,值1.77万亿美元
2026-06-08 13:27:41
一个GPT Plus会员的钱,够机器人跑一个月世界模型了
2026-06-04 13:05:17
AI性能大幅提升!华硕发布PC新品搭载英伟达RTX Spark:支持200B参数模型本地运行
2026-06-05 16:07:23
难上热搜的高考数学,我拿ChatGPT和豆包PK了一把!
2026-06-08 17:37:12
估值2.5亿美元!全球首个AI游戏社区Aippy完成独立融资
2026-06-08 07:13:40
CVPR 2026完美落幕!D4RT封神最佳论文、牛津VGG两连冠,中国本科生泰坦显卡逆袭引爆全网
2026-06-08 16:37:30
程序员爆料:Token烧到扛不住 公司全栈AI项目半路夭折
2026-06-03 17:32:02
亚洲首富只当了三天 孙正义是时代弄潮儿还是追泡沫的人?
2026-06-04 17:16:03
765 文章
651401 浏览
24小时热文
更多
-
2026-06-09 00:54:40 -
2026-06-09 00:53:08 -
2026-06-08 23:49:41