香港大学和字节跳动的研究团队近日推出名为LlamaGen的自回归文生图模型,实现了超越扩散模型的图像生成效果。基于原始自回归架构,该模型在ImageNet测试中表现出色,尤其是在FID、IS、Precision和Recall等指标上。模型开源且已上线,提供了在线体验,显示出自回归模型在图像生成领域的竞争力。研究人员强调,LlamaGen的成就是由于优化的Image Tokenizer和Llama架构的扩展性,未来有潜力在更高分辨率和视频生成等领域发展。
原文链接
本文链接:https://kx.umi6.com/article/2576.html
转载请注明文章出处
相关推荐
换一换
Meta Token-Shuffle 登场:自回归模型突破瓶颈,可 AI 生成 2048×2048 分辨率图像
2025-04-26 14:49:30
英特尔发布 OpenVINO 2025.0:新增图像生成场景与 DeepSeek 蒸馏模型支持
2025-02-15 14:02:57
OpenAI 直播狙击谷歌:奥尔特曼 AGI 梗图现场直出,GPT-4o 超强原生生图来袭
2025-03-26 07:39:42
谷歌 Fluid 颠覆共识:两大因素被发现,AI 文生图领域自回归模型超越扩散模型
2024-10-23 14:39:38
GPT-4o图像生成架构被“破解”了?自回归主干+扩散解码器
2025-04-09 17:59:20
谷歌nano banana官方最强Prompt模板来了!先收藏再说
2025-09-03 16:47:50
Llama也能做图像生成!港大字节推出开源自回归文生图模型,在线体验已开放
2024-07-03 16:53:44
ChatGPT文生图功能迎重大升级:准确生成文字 商用边界大幅拓展
2025-03-26 04:32:17
谷歌Gemini火力全开!实测:原生图像生成新升级确实强
2025-05-08 12:28:50
华人团队终结Token危机:扩散模型数据潜力超自回归三倍
2025-08-13 17:38:29
国产SOTA新模型精准get“画(3+6)条命的动物” | 开源
2025-06-20 17:00:54
谷歌 Nano Banana 2 首批 AI 样本流出:不仅会画画,还懂物理
2025-11-11 11:01:46
微软 Copilot 已支持 GPT-4o 图像生成技术,能力大提升
2025-05-19 19:24:47
601 文章
382959 浏览
24小时热文
更多
-
2025-12-11 00:19:01 -
2025-12-11 00:15:55 -
2025-12-10 23:15:05