谷歌DeepMind团队与麻省理工学院合作推出全新“Fluid”模型,颠覆了自回归模型不如扩散模型的共识。该模型在规模达105亿参数时,实现了最优的文生图效果。通常情况下,扩散模型(如DDPM)在图像生成方面表现更佳,而自回归模型(如GPT系列)则主要用于文本生成。Fluid模型通过使用连续tokens而非离散tokens,以及随机生成顺序而非固定顺序,显著提升了自回归模型的性能。实验表明,Fluid模型在重要基准测试中超越了Stable Diffusion 3扩散模型和谷歌之前的Parti自回归模型。例如,拥有200亿参数的Parti在MS-COCO上FID分数为7.23,而仅含3.69亿参数的Fluid模型达到了相同水平。此研究成果于10月22日由科技媒体The Decoder发布。
原文链接
本文链接:https://kx.umi6.com/article/7742.html
转载请注明文章出处
相关推荐
换一换
DeepMind大模型再登Nature:8分钟预测15日天气,准确度超顶尖物理模型
2024-12-05 16:02:34
扩散模型成最快深度思考!告别自回归每秒1009个tokens,英伟达微软都投了
2026-02-26 10:41:31
英伟达合作推出 Fast-dLLM 框架,AI 扩散模型推理速度最高飙升 27.6 倍
2025-06-03 12:54:51
寡姐带货国风 Polo 衫、马斯克穿牛仔走红毯:虚拟试衣新框架,只需两张图 30 秒即生成
2024-07-30 22:12:57
DiT突遭怒喷,谢赛宁淡定回应
2025-08-20 17:19:58
ViT一作盛赞:这个中国开源“PS模型”强过Nano Banana
2025-12-29 13:21:05
每秒生成超30帧视频,支持实时交互!自回归视频生成新框架刷新生成效率
2025-06-12 14:32:49
刚刚,OpenAI发布sCM提升50倍效率,扩散模型重大技术突破!
2024-10-25 10:40:17
MSRA:视觉生成六大技术问题
2024-07-13 12:09:52
嚯!大语言扩散模型来了,何必只预测下一个token | 人大高瓴&蚂蚁
2025-02-18 13:14:03
冲破 AGI 迷雾,蚂蚁看到了一个新路标
2025-09-29 11:08:37
GAN已死?GAN万岁!布朗康奈尔新作爆火,一夜碾压扩散模型
2025-01-11 17:39:16
何必DiT!字节首次拿着自回归,单GPU一分钟生成5秒720p视频 | NeurIPS’25 Oral
2025-11-14 13:59:52
635 文章
460020 浏览
24小时热文
更多
-
2026-03-09 21:13:27 -
2026-03-09 20:09:26 -
2026-03-09 20:09:18