正文:2025年10月,谢赛宁团队发布新研究,提出用RAE(表征自编码器)替代VAE(变分自动编码器)。RAE结合预训练表征编码器(如DINO、SigLIP、MAE)与轻量级解码器,提供高质量重建和语义丰富的潜空间,支持可扩展的变换器架构。相比VAE,RAE解决了过时骨干网络、信息压缩不足及表征能力弱等问题。实验显示,采用RAE的DiT模型在ImageNet上表现强劲,256×256分辨率下FID仅1.51,且收敛速度比基于VAE的方法快16倍。此外,宽DiT设计、噪声调度和噪声解码器等简单调整显著提升了扩散模型性能。研究论文已公开。
原文链接
本文链接:https://kx.umi6.com/article/26625.html
转载请注明文章出处
相关推荐
换一换
冲破 AGI 迷雾,蚂蚁看到了一个新路标
2025-09-29 11:08:37
英伟达合作推出 Fast-dLLM 框架,AI 扩散模型推理速度最高飙升 27.6 倍
2025-06-03 12:54:51
寡姐带货国风 Polo 衫、马斯克穿牛仔走红毯:虚拟试衣新框架,只需两张图 30 秒即生成
2024-07-30 22:12:57
谢赛宁新作:VAE退役,RAE当立
2025-10-14 17:20:36
DiT突遭怒喷,谢赛宁淡定回应
2025-08-20 17:19:58
DeepMind大模型再登Nature:8分钟预测15日天气,准确度超顶尖物理模型
2024-12-05 16:02:34
OpenAI宋飏被Meta挖跑了!扩散模型崛起关键人物,加入MSL再会师清华校友赵晟佳
2025-09-25 22:11:00
扩散语言模型写代码!速度比自回归快10倍
2025-07-10 17:26:44
刚刚,OpenAI发布sCM提升50倍效率,扩散模型重大技术突破!
2024-10-25 10:40:17
华人团队终结Token危机:扩散模型数据潜力超自回归三倍
2025-08-13 17:38:29
VAE再被补刀!清华快手SVG扩散模型亮相,训练提效6200%,生成提速3500%
2025-10-28 15:54:58
扩散模型还原被遮挡物体,几张稀疏照片也能”脑补”完整重建交互式3D场景|CVPR’25
2025-04-23 13:56:19
嚯!大语言扩散模型来了,何必只预测下一个token | 人大高瓴&蚂蚁
2025-02-18 13:14:03
648 文章
367498 浏览
24小时热文
更多
-
2025-12-07 22:52:28 -
2025-12-07 22:51:22 -
2025-12-07 21:52:07