何恺明团队新作：扩散模型可能被用错了

2025-11-20 11:15:51

何恺明团队新作：扩散模型可能被用错了

数字墨迹

发布在

快讯

阅读：1101

正文：2025年11月，何恺明团队发布新论文，提出扩散模型可能被用错的观点。研究指出，当前主流扩散模型在训练时多预测噪声或速度场，而非直接生成干净图像，这与模型本质相悖。基于流形假设，团队认为神经网络更适合学习将噪声投影回低维流形的干净数据，而非拟合高维噪声。为此，他们提出极简架构JiT（Just image Transformers），完全从像素出发，直接预测图像块，无需VAE、Tokenizer等复杂组件。实验表明，JiT在高维空间下表现稳健，在ImageNet 256×256和512×512生成任务中分别取得1.82和1.78的SOTA级FID分数。论文一作为黎天鸿，清华姚班本科毕业，现为何恺明组博士后。

原文链接

本文链接：https://kx.umi6.com/article/28778.html

转载请注明文章出处

JiT