
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
谷歌DeepMind团队与麻省理工学院合作推出全新“Fluid”模型,颠覆了自回归模型不如扩散模型的共识。该模型在规模达105亿参数时,实现了最优的文生图效果。通常情况下,扩散模型(如DDPM)在图像生成方面表现更佳,而自回归模型(如GPT系列)则主要用于文本生成。Fluid模型通过使用连续tokens而非离散tokens,以及随机生成顺序而非固定顺序,显著提升了自回归模型的性能。实验表明,Fluid模型在重要基准测试中超越了Stable Diffusion 3扩散模型和谷歌之前的Parti自回归模型。例如,拥有200亿参数的Parti在MS-COCO上FID分数为7.23,而仅含3.69亿参数的Fluid模型达到了相同水平。此研究成果于10月22日由科技媒体The Decoder发布。
原文链接
加载更多

暂无内容