正文:2025年10月,谢赛宁团队发布新研究,提出用RAE(表征自编码器)替代VAE(变分自动编码器)。RAE结合预训练表征编码器(如DINO、SigLIP、MAE)与轻量级解码器,提供高质量重建和语义丰富的潜空间,支持可扩展的变换器架构。相比VAE,RAE解决了过时骨干网络、信息压缩不足及表征能力弱等问题。实验显示,采用RAE的DiT模型在ImageNet上表现强劲,256×256分辨率下FID仅1.51,且收敛速度比基于VAE的方法快16倍。此外,宽DiT设计、噪声调度和噪声解码器等简单调整显著提升了扩散模型性能。研究论文已公开。
原文链接
本文链接:https://kx.umi6.com/article/26625.html
转载请注明文章出处
相关推荐
换一换
OpenAI宋飏被Meta挖跑了!扩散模型崛起关键人物,加入MSL再会师清华校友赵晟佳
2025-09-25 22:11:00
何恺明带大二本科生颠覆扩散图像生成:扔掉多步采样和潜空间,一步像素直出
2026-02-02 16:48:05
寡姐带货国风 Polo 衫、马斯克穿牛仔走红毯:虚拟试衣新框架,只需两张图 30 秒即生成
2024-07-30 22:12:57
跳过“逐字生成”!蚂蚁集团赵俊博:扩散模型让我们能直接修改Token | MEET2026
2025-12-12 12:47:17
何恺明团队新作:扩散模型可能被用错了
2025-11-20 11:15:51
材料设计重大突破!微软发布创新大模型,准确率提升10倍!
2025-01-17 16:19:05
谷歌 Fluid 颠覆共识:两大因素被发现,AI 文生图领域自回归模型超越扩散模型
2024-10-23 14:39:38
DeepMind大模型再登Nature:8分钟预测15日天气,准确度超顶尖物理模型
2024-12-05 16:02:34
GAN已死?GAN万岁!布朗康奈尔新作爆火,一夜碾压扩散模型
2025-01-11 17:39:16
图灵奖得主加持,蒙特卡洛树搜索×扩散模型杀回规划赛道|ICML 2025 Spotlight
2025-08-01 14:00:21
冲破 AGI 迷雾,蚂蚁看到了一个新路标
2025-09-29 11:08:37
智源推出全能视觉生成模型 OmniGen:支持文生图、图像编辑等
2024-10-29 16:33:28
谢赛宁新作:VAE退役,RAE当立
2025-10-14 17:20:36
754 文章
542715 浏览
24小时热文
更多
-
2026-04-02 01:24:44 -
2026-04-01 23:18:25 -
2026-04-01 19:09:50