谷歌DeepMind团队与麻省理工学院合作推出全新“Fluid”模型,颠覆了自回归模型不如扩散模型的共识。该模型在规模达105亿参数时,实现了最优的文生图效果。通常情况下,扩散模型(如DDPM)在图像生成方面表现更佳,而自回归模型(如GPT系列)则主要用于文本生成。Fluid模型通过使用连续tokens而非离散tokens,以及随机生成顺序而非固定顺序,显著提升了自回归模型的性能。实验表明,Fluid模型在重要基准测试中超越了Stable Diffusion 3扩散模型和谷歌之前的Parti自回归模型。例如,拥有200亿参数的Parti在MS-COCO上FID分数为7.23,而仅含3.69亿参数的Fluid模型达到了相同水平。此研究成果于10月22日由科技媒体The Decoder发布。
原文链接
本文链接:https://kx.umi6.com/article/7742.html
转载请注明文章出处
相关推荐
换一换
谢赛宁新作:VAE退役,RAE当立
2025-10-14 17:20:36
华人团队终结Token危机:扩散模型数据潜力超自回归三倍
2025-08-13 17:38:29
扩散模型还原被遮挡物体,几张稀疏照片也能”脑补”完整重建交互式3D场景|CVPR’25
2025-04-23 13:56:19
AI视频边生成边播放!首帧延迟仅1.3秒,生成速度9.4帧/秒|Adobe&MIT新研究
2024-12-10 15:56:19
智源推出全能视觉生成模型 OmniGen:支持文生图、图像编辑等
2024-10-29 16:33:28
从不确定到安全:如何安全控制复杂物理系统
2025-07-19 17:56:25
材料设计重大突破!微软发布创新大模型,准确率提升10倍!
2025-01-17 16:19:05
嚯!大语言扩散模型来了,何必只预测下一个token | 人大高瓴&蚂蚁
2025-02-18 13:14:03
物理学家靠生物揭开AI创造力来源:起因竟是“技术缺陷”
2025-07-04 18:47:36
Meta Token-Shuffle 登场:自回归模型突破瓶颈,可 AI 生成 2048×2048 分辨率图像
2025-04-26 14:49:30
英伟达合作推出 Fast-dLLM 框架,AI 扩散模型推理速度最高飙升 27.6 倍
2025-06-03 12:54:51
OpenAI宋飏被Meta挖跑了!扩散模型崛起关键人物,加入MSL再会师清华校友赵晟佳
2025-09-25 22:11:00
12秒生成1万token!谷歌推出文本「扩散模型」Gemini Diffusion,研究员:演示都得降速看
2025-05-22 15:30:59
501 文章
252205 浏览
24小时热文
更多
-
2025-10-24 09:32:35 -
2025-10-24 09:31:18 -
2025-10-24 09:30:10