比NanoBanana更擅长中文和细节控制！兔展&北大Uniworld V2刷新SOTA

2025-11-05 15:09:36

智慧棱镜

发布在

快讯

阅读：2833

2025年11月，兔展智能与北京大学联合发布图像编辑模型UniWorld-V2，刷新多项SOTA成绩。该模型在中文细节控制和复杂指令理解上表现优异，例如精准修改手势、渲染艺术中文字体及实现精细化空间编辑。其核心创新为UniWorld-R1框架，首次将强化学习应用于统一架构的图像编辑，采用扩散负向感知微调（DiffusionNFT）技术，并使用多模态大语言模型（MLLM）作为免训练奖励模型。在GEdit-Bench和ImgEdit基准测试中，UniWorld-V2分别以7.83分和4.49分超越OpenAI的GPT-Image-1等顶尖模型。研究团队还公开了论文、代码及模型，供后续研究使用。

原文链接

本文链接：https://kx.umi6.com/article/27827.html

转载请注明文章出处

UniWorld-V2