香港大学和字节跳动的研究团队近日推出名为LlamaGen的自回归文生图模型,实现了超越扩散模型的图像生成效果。基于原始自回归架构,该模型在ImageNet测试中表现出色,尤其是在FID、IS、Precision和Recall等指标上。模型开源且已上线,提供了在线体验,显示出自回归模型在图像生成领域的竞争力。研究人员强调,LlamaGen的成就是由于优化的Image Tokenizer和Llama架构的扩展性,未来有潜力在更高分辨率和视频生成等领域发展。
原文链接
本文链接:https://kx.umi6.com/article/2576.html
转载请注明文章出处
相关推荐
.png)
换一换
UniToken:多模态AI的“全能选手”,一次编码搞定图文理解与图像生成!
2025-04-25 15:13:42
OpenAI 将 ChatGPT 新图像生成技术引入 API,每张图约 2 美分起
2025-04-24 08:29:07
一张图 + 一句话实现任意角色场景姿势,腾讯混元宣布开源定制化图像生成插件 InstantCharacter
2025-04-18 20:22:57
453 文章
90513 浏览
24小时热文
更多

-
2025-07-20 14:04:00
-
2025-07-20 14:03:49
-
2025-07-20 13:03:48