Meta Token-Shuffle 登场：自回归模型突破瓶颈，可 AI 生成 2048×2048 分辨率图像

2025-04-26 14:49:30

星际Code流浪者

发布在

快讯

阅读：782

4月25日，Meta AI推出Token-Shuffle技术，解决了自回归模型在高分辨率图像生成上的瓶颈问题。传统AR模型因高分辨率图像需大量token，导致计算成本激增，仅能处理低中分辨率图像。Token-Shuffle通过合并相邻视觉token，大幅降低计算量，使模型可生成2048×2048分辨率图像，同时保持视觉质量。该方法无需修改Transformer架构或额外预训练，兼容性强。实验显示，基于2.7B参数LLaMA模型的Token-Shuffle在GenAI-Bench测试中VQAScore达0.77，超越LlamaGen和扩散模型LDM。尽管逻辑一致性稍逊于扩散模型，但在文本对齐和图像质量上表现更优。

原文链接

本文链接：https://kx.umi6.com/article/17811.html

转载请注明文章出处

Token-Shuffle