1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

让AI作画自己纠错!随机丢模块提升生成质量,告别塑料感废片

AI作画和视频生成可以“自我救赎”了!清华大学、阿里巴巴AMAP和中科院自动化研究所的研究团队提出了一种全新方法——S²-Guidance(随机自引导)。其核心亮点是通过随机丢弃网络模块动态构建“弱”子网络,实现生成过程的自我修正。这种方法不仅避免了繁琐的参数调整,还能显著提升生成质量,真正做到即插即用。

S²-Guidance在文生图和文生视频任务中表现出色,具体体现在以下几个方面:
- 卓越的时间动态:如熊的运动姿态或赛车的动态镜头更显流畅。
- 精细的细节渲染:能刻画宇航员头盔的透明质感等复杂细节。
- 更少的视觉伪影:减少跑步者、打伞女性等场景中的瑕疵。
- 丰富的艺术表达:抽象肖像、城堡、彩色粉末爆炸等场景的艺术细节更加饱满。
- 更好的物体协调性:猫与火箭、书与羊等组合的物体关系更加和谐。

CFG的瓶颈:失真与缺乏通用性

传统的CFG(无分类器引导)虽能提升生成质量,但在高引导强度下容易导致过饱和和失真。此前的方法尝试通过引入“弱模型”来修正,但面临弱模型太弱或太强的问题,难以平衡。此外,这些方法通常需要针对不同任务进行复杂调参,缺乏通用性。

S²-Guidance另辟蹊径,不再依赖外部弱模型或复杂调参,而是通过随机丢弃模块让模型自行监督,实现了通用且自动的优化。

S²-Guidance的核心机制:“随机丢模块”

S²-Guidance利用扩散模型的冗余特性,在推理时随机丢弃部分网络模块,动态构建轻量化的子网络。这个子网络暴露了完整模型的潜在错误倾向,从而为生成过程提供“负向引导”。最终,通过简单的“纠错式减法”,模型能够精准规避低质量区域,生成更保真的结果。

研究团队首先在一维和二维高斯混合分布的“玩具实验”中验证了该方法的有效性,随后将其推广到复杂的图像和视频生成任务中。

实验效果:全方位提升

S²-Guidance在多个维度上表现优异:
1. 动态感更强:如熊爬树的动作更有力,赛车的速度感更强。
2. 细节更精致:如宇航员头盔的透明质感、彩色粉末爆炸的瞬间清晰可见。
3. 伪影更少:减少了跑步者肢体扭曲等常见问题。
4. 物体一致性更好:如猫与火箭的比例更加协调。

在视频生成中,S²-Guidance解决了CFG的两大痛点:
- 物理真实性:生成符合物理规律的场景,如卡车正常行驶而非“横向漂移”。
- 复杂指令遵循:如忠实还原“金线环绕人脸并发光”的动态场景。

高效且实用

尽管引入了“自我纠错”机制,S²-Guidance的计算开销却很小。研究表明,即使每个去噪步骤只分裂出一个子网络,效果也几乎与复杂平均相当。这使得S²-Guidance在提升生成质量的同时保持了高效性。

论文链接: https://arxiv.org/abs/2508.12880
项目主页: https://s2guidance.github.io/
项目代码: https://github.com/AMAP-ML/S2-Guidance

原文链接
本文链接:https://kx.umi6.com/article/24053.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
女画师回应AI作画质疑:我参考自己身体画的
2025-03-26 10:47:14
让AI作画自己纠错!随机丢模块就能提升生成质量,告别塑料感废片
2025-08-23 14:01:43
Meta打碎Transformer 8年铁律!改写AI最底层规则,模型首次冒出潜意识
2025-10-25 12:20:19
抖音集团旗下巨量引擎首次披露AI广告治理自研大模型
2025-10-26 21:29:49
AI霸主之争:OpenAI赢下普罗大众 Anthropic却率先征服了企业钱包?
2025-10-27 11:58:08
前瑞银董事长韦伯警告:AI 正引领一个新的不平等时代
2025-10-25 14:25:22
从辅助驾驶到无人驾驶出租车,Mobileye展现技术与商业化双重实力
2025-10-27 16:07:31
开源模型首次物理奥赛夺金!上海AI Lab 235B模型击败GPT5和Grok4
2025-10-25 15:29:19
比尔盖茨女儿也AI创业了!时尚电商,刚被塞了800万美元投资
2025-10-27 18:10:21
阿斯利康在京启用全球战略研发中心
2025-10-25 18:38:20
马斯克:xAI Grok“儿童模式”现已上线
2025-10-26 00:45:16
华西证券:重回“慢牛”趋势 全球科技AI行情共震
2025-10-26 18:25:11
OpenAI进军音乐模型!全球科技巨头竞逐AI“旋律革命”
2025-10-25 18:37:15
24小时热文
更多
扫一扫体验小程序