1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

让AI作画自己纠错!随机丢模块提升生成质量,告别塑料感废片

AI作画和视频生成可以“自我救赎”了!清华大学、阿里巴巴AMAP和中科院自动化研究所的研究团队提出了一种全新方法——S²-Guidance(随机自引导)。其核心亮点是通过随机丢弃网络模块动态构建“弱”子网络,实现生成过程的自我修正。这种方法不仅避免了繁琐的参数调整,还能显著提升生成质量,真正做到即插即用。

S²-Guidance在文生图和文生视频任务中表现出色,具体体现在以下几个方面:
- 卓越的时间动态:如熊的运动姿态或赛车的动态镜头更显流畅。
- 精细的细节渲染:能刻画宇航员头盔的透明质感等复杂细节。
- 更少的视觉伪影:减少跑步者、打伞女性等场景中的瑕疵。
- 丰富的艺术表达:抽象肖像、城堡、彩色粉末爆炸等场景的艺术细节更加饱满。
- 更好的物体协调性:猫与火箭、书与羊等组合的物体关系更加和谐。

CFG的瓶颈:失真与缺乏通用性

传统的CFG(无分类器引导)虽能提升生成质量,但在高引导强度下容易导致过饱和和失真。此前的方法尝试通过引入“弱模型”来修正,但面临弱模型太弱或太强的问题,难以平衡。此外,这些方法通常需要针对不同任务进行复杂调参,缺乏通用性。

S²-Guidance另辟蹊径,不再依赖外部弱模型或复杂调参,而是通过随机丢弃模块让模型自行监督,实现了通用且自动的优化。

S²-Guidance的核心机制:“随机丢模块”

S²-Guidance利用扩散模型的冗余特性,在推理时随机丢弃部分网络模块,动态构建轻量化的子网络。这个子网络暴露了完整模型的潜在错误倾向,从而为生成过程提供“负向引导”。最终,通过简单的“纠错式减法”,模型能够精准规避低质量区域,生成更保真的结果。

研究团队首先在一维和二维高斯混合分布的“玩具实验”中验证了该方法的有效性,随后将其推广到复杂的图像和视频生成任务中。

实验效果:全方位提升

S²-Guidance在多个维度上表现优异:
1. 动态感更强:如熊爬树的动作更有力,赛车的速度感更强。
2. 细节更精致:如宇航员头盔的透明质感、彩色粉末爆炸的瞬间清晰可见。
3. 伪影更少:减少了跑步者肢体扭曲等常见问题。
4. 物体一致性更好:如猫与火箭的比例更加协调。

在视频生成中,S²-Guidance解决了CFG的两大痛点:
- 物理真实性:生成符合物理规律的场景,如卡车正常行驶而非“横向漂移”。
- 复杂指令遵循:如忠实还原“金线环绕人脸并发光”的动态场景。

高效且实用

尽管引入了“自我纠错”机制,S²-Guidance的计算开销却很小。研究表明,即使每个去噪步骤只分裂出一个子网络,效果也几乎与复杂平均相当。这使得S²-Guidance在提升生成质量的同时保持了高效性。

论文链接: https://arxiv.org/abs/2508.12880
项目主页: https://s2guidance.github.io/
项目代码: https://github.com/AMAP-ML/S2-Guidance

原文链接
本文链接:https://kx.umi6.com/article/24053.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
女画师回应AI作画质疑:我参考自己身体画的
2025-03-26 10:47:14
让AI作画自己纠错!随机丢模块就能提升生成质量,告别塑料感废片
2025-08-23 14:01:43
高通砸钱、雷军入股!刚刚,上海诞生一个183亿手机代工巨头
2026-01-22 18:04:11
文心 App 要做社交了?百度内部人士:没有考虑取代微信
2026-01-21 16:18:23
知名游戏女主播怒斥AI修图 花大手笔清除不雅照
2026-01-22 08:43:34
马斯克:年底将出现比人类更聪明的AI 能源是AI最大限制因素
2026-01-23 10:47:05
微软打包收购OpenAI?就差一点!
2026-01-21 17:19:03
成都国资开年「闪击战」背后的产业野望
2026-01-21 20:24:37
百川发布循证增强医疗大模型M3 Plus
2026-01-22 14:59:21
黄仁勋:AI时代蓝领更吃香 水管工、电工能拿六位数薪水
2026-01-22 07:42:15
OpenAI已建立人形机器人实验室 启动以来规模扩大四倍多
2026-01-22 21:11:56
苏州“十五五”规划建议:培育壮大半导体与集成电路、智能网联新能源汽车、工业母机等新兴支柱产业
2026-01-21 20:30:12
金山云星流全面升级,以智算穿越云上AI新周期
2026-01-22 17:01:20
24小时热文
更多
扫一扫体验小程序