香港大学和字节跳动的研究团队近日推出名为LlamaGen的自回归文生图模型,实现了超越扩散模型的图像生成效果。基于原始自回归架构,该模型在ImageNet测试中表现出色,尤其是在FID、IS、Precision和Recall等指标上。模型开源且已上线,提供了在线体验,显示出自回归模型在图像生成领域的竞争力。研究人员强调,LlamaGen的成就是由于优化的Image Tokenizer和Llama架构的扩展性,未来有潜力在更高分辨率和视频生成等领域发展。
原文链接
本文链接:https://kx.umi6.com/article/2576.html
转载请注明文章出处
相关推荐
换一换
8张GPU训出近SOTA模型,超低成本图像生成预训练方案开源
2025-03-19 12:25:56
谷歌Gemini火力全开!实测:原生图像生成新升级确实强
2025-05-08 12:28:50
嚯!大语言扩散模型来了,何必只预测下一个token | 人大高瓴&蚂蚁
2025-02-18 13:14:03
扩散模型失宠?端侧非自回归图像生成基础模型Meissonic登场,超越SDXL!
2024-11-13 14:38:52
谷歌nano banana官方最强Prompt模板来了!先收藏再说
2025-09-03 16:47:50
小米大模型团队提出对角蛇形自回归图像生成方式
2025-04-18 17:22:44
UniToken:多模态AI的“全能选手”,一次编码搞定图文理解与图像生成!
2025-04-25 15:13:42
通义千问开源全新文生图模型Qwen-Image
2025-08-05 07:09:44
微软 Copilot 已支持 GPT-4o 图像生成技术,能力大提升
2025-05-19 19:24:47
腾讯混元图像2模型发布 支持文本、语音、草图等交互方式
2025-05-16 17:13:07
截胡 OpenAI,谷歌全模态模型首次解禁!Gemini 2.0 中文唠嗑式 P 图引动漫游戏圈关注
2025-03-13 15:23:45
OpenAI 扩展 Responses API:支持 MCP、图像生成等
2025-05-22 11:28:26
ChatGPT闯入一条危险赛道:新图像生成功能极擅长伪造收据
2025-04-02 15:32:04
554 文章
293937 浏览
24小时热文
更多
-
2025-10-24 09:34:47 -
2025-10-24 09:33:43 -
2025-10-24 09:32:35