Fluid模型 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

谷歌 Fluid 颠覆共识：两大因素被发现，AI 文生图领域自回归模型超越扩散模型

谷歌DeepMind团队与麻省理工学院合作推出全新“Fluid”模型，颠覆了自回归模型不如扩散模型的共识。该模型在规模达105亿参数时，实现了最优的文生图效果。通常情况下，扩散模型（如DDPM）在图像生成方面表现更佳，而自回归模型（如GPT系列）则主要用于文本生成。Fluid模型通过使用连续tokens而非离散tokens，以及随机生成顺序而非固定顺序，显著提升了自回归模型的性能。实验表明，Fluid模型在重要基准测试中超越了Stable Diffusion 3扩散模型和谷歌之前的Parti自回归模型。例如，拥有200亿参数的Parti在MS-COCO上FID分数为7.23，而仅含3.69亿参数的Fluid模型达到了相同水平。此研究成果于10月22日由科技媒体The Decoder发布。

原文链接