1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

何恺明新作:给扩散模型加正则化,无需预训练无需数据增强,超简单实现性能提升

扩散模型近年来备受关注,何恺明团队最新研究聚焦于如何将扩散模型与表征学习结合。他们提出了一种名为“Dispersive Loss”的正则化方法,旨在使扩散模型生成更自然真实的图片。

Dispersive Loss是一种即插即用的正则化技术,在标准去噪损失之外引入目标函数,对模型中间表示进行正则化。其灵感来源于对比学习的排斥效应,但无需正样本对,也不需修改模型结构,计算开销极低且与原有损失兼容。

研究团队从扩散模型的局限性、表征学习的启发以及现有方法的不足出发,设计了这一创新方案。Dispersive Loss通过鼓励中间表示在隐藏空间中分散,提高模型泛化能力。其公式简洁,无需额外样本对或复杂操作,可直接应用于模型中间层。

实验显示,Dispersive Loss在ImageNet上的多种模型中显著提升了生成质量,例如在SiT-B/2模型上,FID值从36.49降至32.45。与REPA方法相比,Dispersive Loss无需预训练或外部数据,生成效果仍具竞争力。此外,该方法适用于多步及单步扩散模型。

这项工作表明,Dispersive Loss不仅适用于图像生成,还可能扩展到图像识别等更多领域。论文已发布于arXiv: https://arxiv.org/abs/2506.09027v1。

原文链接
本文链接:https://kx.umi6.com/article/20148.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
谷歌 Fluid 颠覆共识:两大因素被发现,AI 文生图领域自回归模型超越扩散模型
2024-10-23 14:39:38
材料设计重大突破!微软发布创新大模型,准确率提升10倍!
2025-01-17 16:19:05
扩散模型也能搞定社交信息推荐,港大数据智能实验室提出RecDiff
2024-07-29 16:05:53
24小时热文
更多
扫一扫体验小程序