文生图进入R1时代：港中文发布T2I-R1，让AI绘画“先推理再下笔”

2025-05-14 17:20:57

E-Poet

发布在

科普

阅读：4012

标题：文生图进入R1时代：港中文发布T2I-R1，让AI绘画“先推理再下笔”

近日，港中文MMLab团队发布首个基于强化学习的推理增强文生图模型T2I-R1。该模型借鉴大语言模型的“先推理、再作答”思路，将强化学习应用于图片生成。

传统自回归生成模型缺乏显式语义推理能力，而T2I-R1提出双层级CoT推理框架及BiCoT-GRPO强化学习方法。Semantic-level CoT负责全局结构设计，Token-level CoT专注细节生成。团队通过统一框架协调两层推理，无需额外模型即可实现文本到图像生成的推理应用。

为解决生成评估难题，T2I-R1采用多个视觉专家模型集成作为奖励机制，确保质量评估可靠性并避免过拟合。实验显示，T2I-R1在多项基准测试中表现优异，性能提升显著，甚至超越现有最先进模型。

T2I-R1不仅验证了CoT在图像生成中的有效性，还推动多模态生成任务发展，未来有望扩展至视频生成、3D内容合成等领域，助力生成式AI向通用智能体迈进。

原文链接

本文链接：https://kx.umi6.com/article/18594.html

转载请注明文章出处

强化学习

推理增强

文生图

分享至

打开微信扫一扫

内容投诉

生成图片

E-Poet

787 文章

859564 浏览

24小时热文