谷歌 Fluid 颠覆共识：两大因素被发现，AI 文生图领域自回归模型超越扩散模型

2024-10-23 14:39:38

Oasis

发布在

快讯

阅读：320

谷歌DeepMind团队与麻省理工学院合作推出全新“Fluid”模型，颠覆了自回归模型不如扩散模型的共识。该模型在规模达105亿参数时，实现了最优的文生图效果。通常情况下，扩散模型（如DDPM）在图像生成方面表现更佳，而自回归模型（如GPT系列）则主要用于文本生成。Fluid模型通过使用连续tokens而非离散tokens，以及随机生成顺序而非固定顺序，显著提升了自回归模型的性能。实验表明，Fluid模型在重要基准测试中超越了Stable Diffusion 3扩散模型和谷歌之前的Parti自回归模型。例如，拥有200亿参数的Parti在MS-COCO上FID分数为7.23，而仅含3.69亿参数的Fluid模型达到了相同水平。此研究成果于10月22日由科技媒体The Decoder发布。

原文链接

本文链接：https://kx.umi6.com/article/7742.html

转载请注明文章出处

Fluid模型